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完全 信息 静态 博弈 


在 本 章 中 , 我们 讨论 如 下 简单 形式 的 博弈 :开始 时 由 参与 者 同时 选择 行 
动 ,然后 根据 所 有 参与 者 的 选择 , 每 个 参与 者 得 到 各 自 的 结果 (一 定 的 收益 
或 支出 ) 。 在 此 类 静态 ( 即 各 方 同 于 行动 ) 的 博 守 中 , 我们 的 分 析 又 仅 限于 完 
全 信息 博弈 的 情况 , 即 每 一 参与 者 的 收益 函数 (根据 所 有 参与 者 选择 行动 的 
不 同 组 合 决 定 某 一 参与 者 收益 的 函数 ) 在 所 有 参与 者 之 间 是 共同 知识 
(common knowledge)。 我 们 在 本 书 的 第 2 章 和 第 4 章 讨论 动态 ( 即 序 贯 行 
动 ) 博 弈 , 在 本 书 的 第 3 章 和 第 4 章 分 析 不 完全 信息 博弈 (博弈 中 的 一 些 参 
与 者 不 知道 其 他 参与 者 的 收益 函数 , 如 拍卖 中 每 一 人 都 不 清楚 其 他 人 到 底 
愿意 为 拍卖 品 出 多 高 的 价格 )。 

在 第 1.1 节 首 先 介 绍 博弈 论 入门 的 两 个 最 基本 则 题 ;如 何 描述 一 个 博 
弃 问 题 以 及 如 何 求 得 博弈 问题 的 解 。 我 们 定义 福 弈 的 标准 式 表述 和 严格 劣 
战略 的 概念 ,并 说 明 有 些 博弈 问题 只 要 运用 理性 参与 者 绝 不 会 使 用 严格 劣 
战略 这 一 原则 , 就 可 得 到 解决 ,但 此 原则 在 其 他 博弈 问题 中 也 可 能 出 现 非常 
不 精确 的 预测 ( 像 任 何 结果 都 有 可 能 发 生 之 类 }。 接 着 , 我 们 引出 纳什 均 衔 
的 概念 并 给 出 定义 一 一 这 一 概念 的 用 途 很 广 , 对 很 多 类 型 的 博弈 都 能 作出 
较为 严格 的 预测 。 

在 第 1.2 节 我 们 运用 前 面 介 绍 的 工具 , 分 析 其 四 个 应 用 模型 : 古 诺 
(Cournot, 1838) 的 不 完全 竞争 模型 , 贝 特 兰 德 (Bertrand, 1883) 的 不 完全 竟 
PAN, 法 怕 (Farber, 1980) 的 最 后 要 价 仲 裁 和 公共 财产 问题 ( 休 访 
(Hume), 1739 年 提出 了 此 类 问题 , 以 后 又 不 断 被 经 济 学 家 提出 讨论 )。 在 
每 一 应 用 例子 中 ,我 们 先 把 问题 的 非 标 准 描述 转化 为 博弈 的 标准 式 ,其 后 再 
解 出 该 博弈 的 纳什 均衡 - (上 面 每 一 俏 子 都 存在 惟一 的 纳什 均衡 ,但 我 们 讨 
论 的 范围 却 不 限于 此 。) 

在 第 1.3 节 重 回 理论 分 析 。 首 先 我 们 定义 混合 战略 (Mixed strategy), 
它 可 理解 为 一 个 参与 者 并 不 能 确定 其 他 参与 者 将 会 如 何 行动 , 然后 引出 并 


2_ Fee 


讨论 纳什 定理 , 该 定理 保证 了 在 非常 广泛 的 博弈 类 型 中 都 看 在 着 纳什 均衡 
(也 许 会 是 混合 战略 均衡 )。 由 于 我 们 在 第 1.1 节 介 绍 了 最 基本 的 理论 .在 “ 
第 1.2 节 安排 了 应 用 举例 ,最 后 在 第 1.3 节 又 给 出 了 更 进一步 的 理论 内 容 ， 
显然 ,在 第 1.3 节 中 更 深入 的 理论 探讨 , 对 第 1.2 节 例 子 的 理解 并 不 是 必须 
的 前 提 , 混合 战 略 的 概念 和 均衡 的 存在 性 在 以 后 各 章 中 都 时 有 提 及 。 

本 章 及 其 后 各 章 后 面 均 附 有 习题 、 建 议 以 及 进一步 的 阅读 资料 及 参考 
文献 目录 。 


1.1 基础 理论 :博弈 的 标准 式 和 纳什 均衡 


1.1.A ”博弈 的 标准 式 表 述 


在 情 蹇 的 标准 式 表 述 中 ,每 一 参与 者 同时 选择 一 个 战略 , 所 有 参与 者 选 
择 战 略 的 组 合 次 定 了 每 个 参与 者 的 收益 。 我 们 借 一 个 经 典 的 例子 说 明 请 弈 
的 标准 式 一 一 囚徒 困 境 。 两 个 犯罪 虹 疑 人 被 捕 并 受到 指控 ,但 除非 至 少 一 
个 大 招 认 犯 罪 ,警方 并 无 充足 证 据 将 其 按 罪 判 刑 。 警 方 把 他 们 关 入 不 同 牢 
室 , 并 对 他 们 说 明 不 同行 动 带 来 的 后 果 。 如 果 两 人 都 不 坦白 ,将 均 被 判 为 轻 
度 犯 罪 ,入 狱 一 个 月 ;如 果 双 方 都 坦白 招 认 , 都 将 被 判 入 铬 6 个 月 ;最 后 , 如 
果 一 人 捐 认 而 另 一 人 拒 不 坦白 , 捆 认 的 一 方 将 马上 获释 ,而 另 一 人 将 判 入 狱 
9 个 月 一 一 所 犯罪 行 6 个 月 ,干扰 司法 加 判 3 个 月 。 

办 徒 面临 的 问题 可 用 下 图 所 示 的 双 变 量 和 矩阵 表 来 描述 。( 正 如 同一 个 
矩阵 一 样 , 双 变 量 答 阵 可 由 任意 多 的 行 和 列 组 成 ,“ 双 变量 " 指 的 是 在 两 个 参 
与 者 的 博弈 中 ,每 一 单元 格 有 两 个 数字 一 一 分 别 表示 两 个 参与 者 的 收益 》 

囚徒 > 


囚徒 的 困境 


在 此 博弈 中 ,每 一 囚徒 有 两 种 战略 可 供 选 择 :坦白 (或 招 认 )、 不 进 白 ( 或 沉 
BR), 在 一 组 特定 的 战略 组 合 被 选 定 后 ,两 人 的 收益 由 上 图 双 灾 量 矩 阵 中 相 
应 单元 的 数据 所 表示 。 习 惯 上 , 横行 代表 的 参与 者 (此 例 中 为 四 徒 1) 的 收 
益 在 两 个 数字 中 放 前 面 , 列 代表 的 参与 者 { 此 例 为 四 徒 2) 的 收益 置 于 其 后 。 
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这 样 ,如 果 因 徒 1 选择 沉 歌 ,囚徒 2 选择 招 认 , 囚徒 1 的 收益 就 是 - %( 代 表 
服刑 9 个 月 ), 囚徒 2 的 收益 为 0( 代 表 马 上 开 释 )。 

现在 我 们 回 到 一 般 情况 。 博 穿 的 标准 式 表 述 包 括 :(1) 博 穿 的 参与 者 ， 
《2) 每 一 参与 者 可 供 选 择 的 战略 集 , (3) 针 对 所 有 参与 者 可 能 选择 的 战略 组 
合 ,每 一 个 参与 者 获得 的 收益 。 我 们 后 面 将 经 常 讨论 到 = 个 参与 者 的 博 
弈 ,其 中 参与 者 从 1 到 ”排序 , 设 其 中 生 一 参与 者 的 序号 为 i, 令 S; 代表 参 
与 者 i 可 以 选择 的 战略 集合 ( 称 为 ; 的 战略 空间 ), 其 中 任意 一 个 特定 的 战 
We As, 表示 (有 时 我 们 写成 %E Se 表示 战略 * ERER S 中 的 要 素 )。 令 
(s1,…, sj) 表示 每 个 参与 者 选 定 一 个 战略 形成 的 战略 组 合 , es 表示 第 :个 
参与 者 的 收益 函数 , ui s1,…, sa ) 即 为 参与 者 选择 战略 (51,…, sa ) 时 第 i 个 
参与 者 的 收益 。 将 上 述 内 容 综 合 起 来 , 我 们 得 到 : 


定义 ”在 一 个 n 人 博弈 的 标准 式 表 述 中 ,参与 者 的 战略 空间 为 S1,…， 
Se 收益 函数 为 ayy, un 我们 用 G = FSi, Sahu xs} 表示 此 博 
Fo 


尽管 我 们 普 提 到 在 博弈 的 标准 式 中 .参与 者 是 同时 选择 战略 的 , 但 这 并 
不 意味 着 各 方 的 行动 也 必须 是 同时 的 :只 要 是 每 一 参与 者 在 选择 行动 时 不 
知道 其 他 参与 者 的 选择 就 足够 了 , 像 上 例 中 牢 里 分 开关 押 的 囚徒 可 以 在 任 
何 时 间作 出 他 们 的 选择 。 更 进一步 ,尽管 在 本 章 中 请 弈 的 标准 式 只 用 来 表 
示 参 与 者 行动 时 不 清楚 他 人 选择 的 静态 博弈 ,但 在 第 2 章 中 我 们 就 会 看 到 
标准 式 也 可 用 来 表示 序 贯 行动 的 博弈 , 只 不 过 另 一 种 变通 的 方式 一 一 博弈 
的 扩展 式 表 述 更 为 常用 , 它 在 分 析 动 态 问题 时 也 更 为 方便 。 


1.1.B BAR RRE 


上 节 已 讲 讨 一 个 博弈 的 表述 方法 ,下面 开 始 介绍 如 何 着 手 分 析 一 个 博 
弈 论 间 题 。 我 们 从 囚徒 的 困境 这 个 例子 开始 , 因为 它 较为 简单 ,只 需 用 到 理 
性 的 参与 者 不 会 选择 严格 劣 战略 这 一 原则 。 

在 囚徒 的 困境 中 , 如 果 一 个 嫌疑 犯 选择 了 招 认 , 那么 另 一 人 也 会 选择 招 
认 , 被 判刑 5 个 月 ,而 不 会 选择 沉默 从 而 坐 9 个 月 的 牢 :相似 地 , 如 果 一 个 嫌 
疑犯 选择 沉默 , 另 一 人 还 是 会 选择 扫 认 , 这 样 会 马上 获释 , 而 不 会 选择 沉默 
在 牢 里 流 过 一 个 月 。 这 样 ,对 第 i 个 囚徒 讲 , 沉默 相 比 招 认 来 说 是 劣 战 
路 一 一 对 因 徒 了 可 以 选择 的 每 一 战略 , 囚徒 i 选择 沉默 的 收益 都 低 于 选择 
招 认 的 收益 。( 对 任何 双 变 量 和 矩阵 ,上 例 中 的 收益 的 具体 数字 0, - 1, 6， 
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-9 换 成 任意 的 T R. P.S, 只 要 满足 工 > 尺 >P>S, 上 述 结论 依然 戒 
立 。) 更 为 一 般 地 : 


定义 ”在 标准 式 的 博弈 G = 5S1,…, Sarun iiH, O st 和 st 代表 
参与 者 i 的 两 个 可 行 战略 ( 即 s; 和 sf 是 5; 中 的 元 素 )。 如 果 对 其 他 参与 者 
每 一 个 可 能 的 战略 组 合 , i 选择 s 的 收益 都 小于 其 选择 s; 的 收益 , 则 称 战 略 *; 相 
对 于 成 略 s: 是 严格 劣 战略 ; 


gs (DS) 


对 其 他 参与 者 在 其 战略 空间 S1,…, Siis Si+1,…, Sa 中 每 一 组 可 能 的 战 
BEC sists 3E- 1o 3+1 vs) 都 成 立 。 

理性 的 参与 者 不 会 选择 严格 劣 战略 , 因为 他 (对 其 他 人 选择 的 战略 ) 无 
法 作出 这 样 的 推断 , 使 这 一 战略 成 为 他 的 最 优 反应 。 这 样 ,在 办 徒 的 困境 
中 ,一 个 理性 的 参与 人 会 选择 招 认 , TRAN, 招 认 ) 就 成 为 两 个 理性 参与 
者 的 结果 ,尽管 ( 招 认 , 招 认 ) 带 给 双方 的 福利 都 比 ( 沉 默 , RR. AE 
的 困境 的 例子 还 有 很 多 应 用 , 我 们 将 在 第 2 章 和 第 4 章 讨论 它 的 变型 。 现 
在 , 我 们 来 看 理性 参与 者 不 选择 严格 劣 战 略 这 一 原则 是 否 能 解决 其 他 博弈 
问题 。 


BSA2 
左 中 有 


+ Cs 


图 1.1.1 
考虑 图 1.1.1 所 示 抽 和 象 博弈 的 例子 ,@ 参与 人 1 AMT HMR, 参 


与 人 2 有 3 个 可 选 战略 :Si = 1 上 ,下 }, Sz= | 左 , 中 , 右 j。 对 参与 人 1 来 
讲 , 上 和 下 部 不 是 严格 占 优 的 :如 果 2 选择 左 , 上 优 于 下 (因为 1>0), 但 如 2 


钙 ” 相 应 的 逆 合 是 也 很 有 趣 : 如 界 某 一 参与 者 (对 其 他 分 与 者 饮 择 的 战 赂 ) 无 法 作出 这 样 的 推 
B, 从 而 使 战略 s; 成 为 他 的 最 优 反 应 , 我 们 能 否 得 到 结论 , 一 定 存在 另 一 战略 是 s; 的 严格 占 优 战 
E? 答案 是 肯定 的 。 前 担 是 对 “推断 "和 "* 另 一 战略 "的 正确 理解 .两 者 者 涉及 到 将 在 第 1.3.A 节 中 
介绍 的 混合 战略 。 

加 ”本 书 的 绝 大 多 数 例 子 都 取 自 经 济 学 的 实际 应 用 , 而 很 少 使 用 纯 数 字 的 抽象 调子 , 这 不 仅 因 
为 应 用 本 身 往往 锯 有 趣味 , 还 因为 应 用 经 常 是 解释 理论 的 较 好 方式 。 不 过 在 说 明 一 些 基本 的 理论 
原 环 时 ,我 们 有 时 也 求助 于 没有 现实 经 济 含义 的 抽象 例子 。 
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选择 右 , 下 就 会 优 于 上 (因为 2> 0)。 但 对 参与 人 2 RH, 右 严格 劣 于 中 ( 因 
为 2>1 且 1>0), 因 此 理性 的 参与 人 2 是 不 会 选择 右 的 。 那 么 , 如 果 参 与 
Al MBS A 2 是 理性 的 , 他 就 可 以 把 右 从 参与 人 2 的 战略 空间 中 刚 除 ， 
即 如 果 参 与 人 1 知道 参与 人 2 是 理性 的 , 他 就 可 以 把 图 1.1.1 aR 
同 为 图 1.1.2 REF: 


参与 人 2 
左 中 
1,0 1,2 
0.3 01 


参与 人 1 


图 1.1.2 


在 图 1.1.2 中 ,对 参与 人 1 来 讲 ,下 就 或 了 上 的 严格 劣 战 略 , 于 是 如 果 
参与 人 1 是 理性 的 (并 且 参 与 人 1 知道 参与 人 2 是 理性 的 ,这 样 才能 把 原 捕 
穿 简化 为 图 1.1.2), 参 与 人 1 就 不 会 选择 下 。 那 么 , 如 果 参 与 人 2 知道 参 
与 人 1 是 理性 的 ,并 且 人 参与 人 2 知道 参与 人 1 知道 参与 人 2 是 理性 的 (从 而 
参与 人 2 知道 原 博弈 将 会 简化 为 图 1.1-2 FRB), 参与 人 2 就 可 以 把 下 
从 参与 人 1 的 战略 空间 中 剔除 , 余下 图 1.1.3 所 示 博 弈 。 但 这 时 对 参与 人 
2, 左 又 成 为 中 的 严格 劣 战 略 , 仅 剩 的 (上 , 中 ) 就 是 此 博弈 的 结果 。 

参与 人 2 


左 中 
大 与 hi F | 03 0.1 
1.1.3 


上 面 的 过 程 可 称 为 "重复 剔除 严格 劣 战 略 "。 尽 管 此 过 程 建立 在 理性 参 
与 人 不 会 选择 严格 劣 战 略 这 一 合 情 近 理 的 原则 之 上 , 它 仍 有 两 个 缺陷 :第 
一 ,每 一 步 别 除 都 需要 参与 者 间 相 互 了 解 的 更 进一步 假定 ,如 果 我 们 要 把 这 
一 过 程 应 用 到 任意 多 步 ,就 需要 假定 “参与 者 是 理性 的 "是 共同 知识 。 这 意 
味 着 ,我们 不 仅 需 要 假定 所 有 参与 人 是 理性 的 , 还 要 假定 所 有 参与 人 都 知道 
所 有 参与 人 是 理性 的 , 还 需要 假定 所 有 参与 人 都 知道 所 有 参与 人 都 知道 疡 
有 参与 人 是 理性 的 ,如 此 等 等 .以 至 无 穷 ( 关 于 共同 知识 的 正式 定义 参见 奥 
(Aumann, 1976)). 

重复 剔除 严格 劣 战略 的 第 二 个 缺陷 在 于 这 一 方法 对 博 诗 结果 的 预测 经 
常 是 不 精确 的 。 例 如 , 在 1.1.4 中 的 博弈 中 , 就 没有 可 以 剔除 的 严格 劣 战 
略 。〈 由 于 没有 现实 事件 作为 基础 , 这 一 博 蛮 可 能 会 被 认为 是 随意 编制 或 不 


6__ PORE at 


SBR, 为 此 我 们 还 可 以 参考 1.2.A 中 经 济 学 应 用 部 分 反映 司 一 实质 的 
3 个 及 更 多 企业 的 古 诺 模型 ) 既 然 所 有 战略 都 经 得 住 对 严格 劣 战略 的 重复 
BER, 该 方法 对 分 析 博 变 将 出 现 什 么 结果 毫 无 帮助 。 

左 中 a 


# 0,4 4,0 5,3 


4 
+ 
o 


0.4 3,3 


F 3.5 3.5 6.6 


1.1.4 


下 面 我 们 介绍 纳什 均衡 , Ee A EY A A BY LA PTE 2 
型 的 博弈 作出 严格 得 多 的 预测 。 我 们 通过 参与 者 的 纳什 均衡 战略 绝 不 会 在 
重复 则 除 严格 劣 战略 的 过 程 中 被 删除 掉 , 而 重复 刚 除 劣 战 略 后 所 留 战略 却 
不 一 定 满足 纳 秆 均衡 战略 的 条 御 , 来 证 明 纳什 均衡 是 一 个 比重 复 副 除 严 格 
劣 城 略 要 强 的 解 的 概念 。 以 后 各 章 我 们 还 将 证 明 在 扩展 式 的 博弈 中 , 甚至 
纳什 均衡 对 博弈 结果 的 预测 也 可 能 是 不 精确 的 , 从 而 还 需要 定 文 条 件 更 为 
严格 的 均衡 概念 。 


1.1.C 纳什 均衡 的 导出 和 定义 


导出 纳什 均衡 的 途径 之 一 , 是 证 明 如 果 博 弈 论 还 可 以 为 博弈 疝 题 提供 
一 个 惟一 解 , 此 解 一 定 是 纳什 均衡 ,原因 如 下 。 设 想 在 博 弃 论 预测 的 博弈 结 
果 中 ,给 每 个 参与 者 选 定 各 自 的 战略 , 为 使 该 预测 是 正确 的 , 必须 使 参与 者 
自愿 选择 理论 给 他 推导 出 的 战略 。 这 样 ,每 一 参与 者 要 选择 的 战略 必须 是 
针对 其 他 参与 者 选择 战略 的 最 优 反 应 , 这 种 理论 锥 测 结果 可 以 叫做 “战略 稳 
定 " 或 “自动 实施 "的 ,因为 没有 参与 人 愿意 独自 离弃 他 所 选 定 的 战略 , 我 们 
把 这 一 状态 称 为 纳什 均衡。 


定义 在 ”个 参与 者 标准 式 博弈 G =1S1,…, Snir > us| 中 ,如 果 
战略 组 合 |sf? ,，…, s; i 满足 对 每 一 参与 者 i, si 是 (至 少 不 淄 于 ) 他 针对 其 
他 in — 1 PB A EARNS | sf os Poa seas cy sa | 的 最 优 反 应 战略 , 则 
ARRAS isi, osa } 是 该 博弈 的 一 个 纳什 均 稀 。 即 


uelsi ss Shia ST shai Sa) 


Beast ot, EE SnD + (NE) 


PIF ZORRO 7 
对 所 有 Si PÉI s; 都 成 立 , 亦 即 s7 是 以 下 最 优化 问题 的 解 : 


maxuy sq sits SP Ses Siti Sn be 
miax TEN a +4 i 


PACT TE MAFF fee He El OE SERRER, 设想 有 一 标准 式 博弈 G = 
Sys Sy sues un| ,博弈 论 为 它 提供 的 解 为 战略 组 合 1s1,-…, s i 如果 
153,…, ss | 不 是 G 的 纳什 均衡 , 就 意味 着 存在 一 些 参与 人 i, si 不 是 针对 
Users Sinus Shen ,54| 的 最 优 反应 战略 , 即 在 S; 中 存在 sf ,使 得 : 


STN US dE Span SE Stee Ts Sa) 


那么 , DU RAG EID Te GEA a EE is, s“ 1 不 是 纳什 均衡 , 则 至 少 有 
AHS SSA DRA ELH, LB SEA TUT Bit RT 
和 纳什 均衡 推导 密切 相关 的 是 协议 的 理念 :对 给 定 的 博弈, MRSS ZB 
要 商定 一 个 协议 决定 博 守 如 何 进行 ,那么 一 个 有 效 的 协议 中 的 战略 组 合 必 
须 是 纳什 均衡 的 战略 组 合 , 否则 , 至 少 有 一 个 参与 人 会 不 遵守 该 协议 。 

为 更 准确 地 理解 这 一 概念 , 下面 求解 几 个 例题 。 考 虑 前 面 已 描述 过 的 
三 个 标准 式 情 弈 一 一 因 徒 的 困境 、 图 1.1.1 和 图 1.1.4。 寻 找 博 弈 纳什 均 
衡 的 一 个 最 直接 办 法 就 是 简单 查看 每 一 个 可 能 的 战略 组 合 是 否 符合 定义 中 
不 等 式 (NE) 的 条 件 ,P 在 两 人 博弈 中 , 这 一 方法 开始 的 程序 如 下 :对 每 一 
个 参与 者 ,并 且 对 该 参与 者 每 一 个 可 选 战 略 ,确定 另 一 参与 者 相应 的 最 优 战 
mo E 1.1.5 中 ,就 把 图 1.1.4 RERET LELE, 对 参与 者 ; 的 每 一 
个 可 选 战略 , 在 参与 者 ; 使 用 最 优 反应 战略 时 的 收益 下 面 划 了 横 线 。 例 如 ， 
如 果 列 参与 人 选择 左 , 行 参 与 人 的 最 优 战 略 将 会 是 中 (因为 4 比 3 和 0 都 要 
大 ), 于 是 我 们 在 双 变 量 和 矩阵 (中 , 左 ) 单 元 内 行 参 与 人 的 收益 “4” 下 划一 条 模 
线 。 


a 中 右 


+ 0,4 4,0 5,3 


如 


4,0 a4 5,3 
F 3,5 3.5 6.6 


图 1.1.5 
如 果 在 一 对 战略 中 , 每 一 参与 人 的 战略 都 是 对 方 战略 的 最 优 反应 战略 ， 
四 “在 第 1.3.A 节 中 ,我 们 将 区 分 纯 成 略 和 温 合 战略 , 那 时 我 们 就 会 看 到 此 处 所 给 的 纳什 均衡 


定义 是 指 纯 战 赂 均 檀 ,但 有 时 也 可 能 有 混合 战略 均衡 存在 。 除 非 有 明确 说 明 , 本 节 所 说 结 竹 均衡 都 
是 指 纯 战 略 均衡 。 


&_ re se 


则 这 对 战略 满足 不 等 式 (INE) 的 条 件 ( 亦 即 双 变量 矩阵 相应 单元 的 两 个 收益 
值 下 面 都 被 划 了 横 线 )。 这 样 , (于 . 右 ) 是 惟一 一 对 满足 (NE) 的 战略 组 合 。 
同样 的 过 程 可 得 到 囚徒 困境 中 的 战略 组 合 ( 招 认 , 招 认 )、 图 1.1.1 中 的 战略 
组 合 ( 上 ,中 )。 这 些 战 略 组 合 就 是 各 自 博弈 中 惟一 的 纳什 均衡 - 

下 面 我 们 重点 分 析 纳 什 均 衡 和 重复 删除 严格 劣 哉 略 均衡 的 关系 。 我 们 
已 经 看 到 , AERAR 1.1.1 中 的 纳什 均衡 一 一 分 别 为 《 揪 认 , 招 认 ) 和 
《上 ,中 ) 一 一 正 是 经 过 重复 删除 严格 劣 战 略 后 仅 剩 的 战略 组 合 。 这 一 结果 
可 总 结 为 :如 果 用 重复 刚 除 严格 先 战 略 把 除 战 略 组 合 1s7 ,…，,s* 外 所 有 的 
战略 组 合 都 日 除 掉 , 则 该 所 存 战 略 组 合 就 是 此 博弈 惟一 的 纳什 均衡 (参见 在 
附录 1,1.C 中 这 一 结论 的 证 明 }。 不 过 , 由 于 重复 剔除 严格 劣 战 略 并 不 经 
常会 只 剩 下 惟一 的 战略 组 合 ,纳什 均衡 作为 比重 复 噜 除 严 格 劣 战略 更 强 的 
解 的 概念 ,自然 受到 更 多 关注 , 理由 如 下 。 如 果 战 略 组 合 和 5 了,…, s*} 是 一 
个 纳什 均衡 , 它 一 定 不 会 被 重复 期 除 严格 劣 战 略 所 日 除 (同样 参见 附录 中 的 
证 明 ), 查 也 可 能 有 重复 刚 除 严格 劣 战略 无 法 删除 的 战略 组 合 , 其 本 身 却 和 
纳什 均衡 一 点 儿 关 系 都 没有 。 为 理解 这 一 点 ,请 想 一 下 图 1.1.4 RR, 
纳什 均衡 给 出 了 惟一 解 (下 , 右 ), 但 重复 唱 除 严格 劣 战略 却 给 出 了 最 大 不 确 
定性 的 预测 :没有 任何 战略 组 合 被 吻 除 , 什么 结果 都 有 可 能 出 现 。 

证 明了 纳 付 均衡 是 一 个 比 午 复 吻 除 严格 劣 战 略 条 件 更 强 的 解 的 概念 之 
后 ,我 们 还 必须 解 块 一 个 问题 , RAAT HERERO RS, FEES 
太 强 了 , 即 我 们 能 和 否 确定 纳什 均衡 一 定 是 存在 的 ? 纳什 (1950) 证 明了 在 任 
何 有 限 博弈 ( 即 参与 者 n 和 战略 集 S1,…, Su 都 是 有 限 的 博弈 ) 中 , 都 存在 
至 少 一 个 纳什 均衡 (这 一 均衡 可 能 包含 了 混合 战略 , 我们 将 在 1.3.A 中 讨 
论 ,并 参见 1.3.B 中 关于 纳什 定理 的 精确 表述 )。 古 诺 (1838) 在 双 头 垄断 
模型 这 一 特定 的 环境 中 提出 了 同样 的 均衡 梳 念 , 并 通过 构造 的 方法 证 明了 
横 型 中 均衡 的 存在 性 (参见 第 1.2.A 节 )。 在 本 书 的 每 一 个 应 用 分 析 中 , 我 
们 都 将 沿袭 古 诺 的 思路 :即将 通过 构造 一 个 纳什 均衡 (或 条 件 更 强 的 均衡 ) 
的 方法 ,证 明 均 衡 本 身 的 存在 性 。 不 过 在 一 些 理论 章节 中 , 也 有 直接 依据 纳 
什 定理 (或 条 件 更 强 时 的 类 似 定理 ), 简单 断定 均衡 存在 的 情况 。 

我 们 用 另 一 经 典 例子 作为 本 节 小 结 一 一 性 别 战 博 弈 。 这 一 例子 表明 一 
个 博 讲 可 以 有 多 个 纳什 均衡 , 并 且 在 第 1.3.B 和 第 3.2.A 节 讨 论 混合 战略 
时 也 用 得 到 。 关 于 这 一 博弈 的 传统 表述 (要 知道 这 一 博弈 从 20 世纪 50 年 


四 ”这 一 结论 即使 在 不 限于 纯 战 略 的 条 件 下 也 亲 样 成 立 , 因为 在 这 些 战略 中 不 存在 混合 战略 
纳 秆 均衡 。 参 见习 题 1.10- 
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代 就 开始 使 用 了 ), 是 一 男 一 女 试图 决定 安排 一 个 晚上 的 娱乐 内 容 , 我 们 分 
析 这 一 博弈 的 中 性 版 本 。 不 在 同一 她 方 工作 的 帕 特 和 克 里 斯 必须 就 去 听 歌 
剧 和 看 职业 拳击 赛 选 择 其 一 , 帕 特 和 克 里 斯 都 希望 两 人 能 在 一 起 渡 过 一 个 
夜晚 , 而 不 愿 分 开 , 但 帕 特 更 希望 能 一 起 看 拳击 比赛 , 克 里 斯 则 希望 能 在 一 
起 欣赏 歌剧 , OP ARE PE : 


rt 
Re a 
wa [z | oo | 
xam 
[| 


ei 0,0 


EMRE 


(歌剧 , REDA CRE, PWERSA, 

以 上 我 们 论证 了 如 果 博 弈 论 可 以 为 一 个 博弈 提供 惟一 解 , 此 解 一 定 是 
一 个 纳什 均衡 。 这 一 命题 没有 提 及 博弈 论 不 能 提供 惟一 解 的 可 能 情况 。 同 
时 还 论证 了 如 果 参 与 者 之 人 间 能 就 如 何 进行 给 定 的 博弈 达成 一 个 协议 , 该 协 
议 也 一 定 是 一 个 纳什 均衡 ,但 这 一 命题 同样 没有 考虑 不 能 达成 协议 的 可 能 
情况 。 在 一 些 有 多 个 纳什 均衡 的 祖 弈 中 , 有 一 个 均衡 比 其 他 均衡 明细 占 优 
(后 面 各 章 的 主要 理论 内 容 就 是 找 出 不 同类 型 博 赛 的 这 种 占 优 均衡 ), 这 时 ， 
多 个 纳什 均衡 的 存在 本 身 也 不 会 引出 其 他 问题 。 不 过 , 在 上 面 讲 的 性 别 战 
博弈 中 , (歌剧 , 歌剧 ) 和 ( 源 击 ,拳击 ) 又 难 分 优 劣 ,这 说 明博 弈 论 对 有 些 博 穿 
并 不 能 提供 惟一 解 ,参与 者 则 也 不 能 就 该 博弈 的 进行 达成 苏 议 。P 在 这 样 
的 博弈 中 , 纳什 均衡 用 于 预测 博弈 将 如 何 进行 的 作用 就 大 大 减弱 了 。 


峙 录 1.1.C 


本 附录 是 关于 1.1.C 提 到 的 两 个 命题 的 证 明 , 跳 过 这 些 证 明 对 以 后 内 
容 的 理解 不 会 有 很 大 影响 。 不 过 , 对 于 不 太 说 熟 正规 定义 及 证 明 操 作 的 读 
者 ,掌握 这 些 证 明 程序 也 是 一 种 有 益 的 训练 。 


命题 A 在 x 个 参与 者 的 标准 式 清 弈 G= 1S1,…, Sw al 中， 


D 在 第 1.3.B 节 中 ,我 们 将 描述 性 别 战 博 突 的 第 三 个 纳什 均衡 (含有 泥 合 战略 )。 不 同 于 ( 隘 
出 ,歌剧 和 { 产 击 , 掌 击 的 是 , 该 第 三 均衡 有 对 条 的 收益 一 一 正如 在 对 称 博 弈 中 存在 惟一 均衡 的 情 
况 一 样 ; 另 一 方面 ,该 第 三 均 策 仍 是 无 效率 的 ,因为 它 的 导出 违背 了 协议 的 原则 。 不 过 , 无论 我 们 对 
性 别 战 银 穿 中 的 纳什 均 守 如 何 评判 , 二 面 的 命 丁 仍 是 成 立 的 : 即 存在 博弈 论 无 法 惟一 解 .并 无 法 达 
BARE, 
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GR ADR EE AS SH RS hs s*1 外 的 所 有 战略 , 那 
么 这 一 战略 组 合 为 该 博弈 惟一 的 纳什 均衡 。 


SRB 在 = 个 参与 者 的 标准 式 博弈 G = {Su Spina, 
如 果 战 略 1s7 ,…, s {是 一 个 纳什 均衡 ,那么 它 不 会 被 重复 刚 除 严格 劣 战 略 
所 剔除 。 


由 于 命题 B 的 证 明 比 较 简单 , 我 们 先 用 它 作 一 个 热身 。 论 证 使 用 反 证 
法 , 即 我 们 先 假定 一 个 纳什 均衡 解 在 重复 别 除 严格 劣 战略 的 过 程 中 被 吻 除 
掉 了 , 然后 证 明 如 果 该 假定 成 立 ,就 会 有 自 相 矛盾 的 结果 出 现 ,从 而 证 明 恨 
定 本 身 是 错误 的 。 

设想 战略 1s? ,…, sf 1 是 标准 式 博弈 G = 1S1,…, Ss; wi,…, ta 的 一 
个 纳什 均衡 , 但 同时 假定 (也 许 在 噜 除 掉 fs ，…, ;之 外 的 一 些 战略 之 后 ) 
在 {sf ,…,s31 中 ,si 首先 称 为 频 被 刚 陈 的 严格 劣 战 略 ,那么 S; 中 一 定 存 
在 尚未 被 吻 除 的 战略 i 严格 优 于 sy， 。 代 入 公式 (DS) ,我 们 得 到 


ilsir r Siers S] s Sarlo s Sa) L ti CS1 ts Sa SF p Sits rSn) o 
{1.1.1) 
对 每 一 个 其 他 参与 者 尚未 被 吻 除 的 战略 空间 中 可 能 形成 的 战略 组 合 
(sys Spee Sa BRE AT si 是 均衡 战略 中 第 一 个 被 剔除 的 
战略 , 均衡 战略 中 其 他 参与 人 的 战略 尚未 被 刚 除 ,于 是 作为 (1.1.1) 的 一 个 
特例 , 下 式 成 立 


LE TE ES i ela e atua a 
_ (1.1.2) 
但 是 (1.1.2) 和 公式 (NE) 是 矛盾 的 :根据 (NE),s” 必须 是 针对 (s?， 
ss) 的 最 优 反应 , 那么 就 不 可 能 存在 一 个 战略 s; 严格 优 
于 s? 。 这 一 牙 盾 证 明了 原 命题 成 立 。 
证 明 过 命题 B, 我 们 事实 上 已 经 证 明了 命题 A 的 一 部 分 :所 有 需要 证 明 
的 只 是 如 果 重复 噜 除 严 格 劣 战 略 别 除了 除 1s7 ,…, sa ZI RARR, 
战略 是 纳什 均衡 ,根据 命题 B. 任何 其 他 的 纳什 均衡 必定 同样 未 被 噜 除 . 这 
已 证 明了 在 该 博弈 中 均衡 的 惟一 性 。 我 们 假设 G 是 有 限 博弈 。 
论证 同样 使 用 反 证 法 。 假 定 通过 重复 删除 严格 劣 战 格 吻 除 掉 除 1s* ， 
,51 外 的 所 有 战略 ,但 该 战略 不 是 纳什 均衡 。 那 么 一 定 有 某 一 参与 者 宇 
在 他 的 战略 集 S, 中 存在 ;;, 使 公式 (NE) 不 成 立 ,但 s 又 必须 是 在 别 除 过 程 


uh 
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某 一 阶段 的 严格 劣 战略 。 上 述 两 点 的 正规 表述 为 :在 Si 中 存在 存在 4 使 


r err A si sient Se asl or sii. Sin FE sn) 
(hb) 
并 且 在 参与 者 i 的 战略 集中 存在 si ,在 剔除 程序 中 的 某 一 阶段 
Si 
(1.1.4) 


HAARA pF TE KBr Be Fe OY AB AS ME (si, si;-1， 
Sist mm) 都 成 立 。 由 于 其 他 参与 者 的 战略 (ps ta 
终 未 被 刚 除 ,于 是 下 式 作为 (1.1.4) 的 一 个 特例 成 立 


人 

(115) 

如 果 sf = 57 (E s? 是 s 的 严格 占 优 战 略 ), 则 1.1.5 和 1.1.3 BEF 

盾 , 这 时 证 明 结束 。 如 果 s, ts) ,由 于 st 在 最 终 被 剔除 掩 了 , 则 一 定 有 其 

他 战略 sf 在 其 后 严格 优 于 s; 。 这 样 , 在 不 等 式 (1.1.4) 和 (1.1.5) 中 ,分 别 

用 s: 和 于 换 下 s Ms; 后 仍然 成 立 。 再 一 次 ,如 果 s = sy 则 证 明 结 束 , 否 

则 ,还 可 构建 两 个 相似 的 不 等 式 。 由 于 *” BS, 中 惟一 未 被 别 除 的 战略 ; E 
复 这 一 论证 过 程 (在 一 个 有 限 的 博弈 中 ) 最 终 一 定 能 完成 证 明 。 


1.2 应 用 举例 


1.2.A 上 古 诺 的 双 头 垄断 模型 


正如 前 节 已 提 到 的 , 古 诺 (1838) 早 在 一 个 多 世纪 之 前 就 已 提出 了 纳什 
所 定义 的 均衡 (但 只 是 在 特定 的 双 头 芭 断 模型 中 )。 古 诺 的 研究 现在 已 理 所 
当然 地 成 为 博弈 论 的 经 典 文献 之 一 ,同时 也 是 产业 组 织 理论 的 重要 里 程 碑 。 
这 里 ,我 们 只 讨论 古 诺 模型 的 一 种 非常 简单 的 情况 ,并 在 以 后 每 章 中 都 会 涉 
及 到 这 一 模型 的 不 同 变型 。 本 节 我 们 将 通过 模型 说 明 ;(a) 如 何 把 对 一 个 问 
题 的 非 正式 描述 转化 为 一 个 博弈 的 标准 式 表述 ;(b) 如 何 通过 计算 解 出 博弈 
的 纳什 均衡 ic) 重复 别 除 严格 劣 战略 的 步骤 。 

令 g1、qz 分 别 表 述 企 业 1.2 生产 的 同 质 产 品 的 产量 , 市 场 中 该 产品 的 
总 供给 Q= 914 9g2, 令 P(Q)=a 一 Q 表示 市 场 出 清 时 的 价格 (更 为 精确 一 
些 的 表述 为 :Q<a 时 ,P(Q)=a -QiQ>a 时 ,P(Q)=0)。 设 企业 : E 
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Fa 的 总 成 本 Ci(g;)==cqi, 即 企业 不 存在 固定 成 本 , 且 生 产 每 单位 产品 的 
边际 成 本 为 常数 <, 这 里 我 们 假定 。< a。 根 据 古 诺 的 假定 , 两 个 企业 同时 
进行 产量 决策 ?了 。 

为 求 出 古 诺 博弈 中 的 纳什 均衡 , 我 们 首先 要 将 其 化 为 标准 式 的 博弈 。 
前 节 已 讲 过 , 博 诗 的 标准 式 表 述 包 含 下 列 要 素 :(1) 博 弈 的 参与 人 , (2) 每 一 
参与 人 可 以 选择 的 战略 , (3) 针 对 每 一 个 可 能 出 现 的 参与 人 的 战略 组 合 ,每 
一 参与 人 的 收益 。 双 头 鸡 断 模型 中 当然 只 有 两 个 参与 人 , 即 模型 中 的 两 个 
垄断 企业 。 在 古 诺 的 模型 里 ,每 一 企业 可 以 选择 的 战略 是 其 产品 产量 ,我 们 
假定 产品 是 连续 可 分 割 的 。 由 于 产 出 不 可 能 为 负 ,每 一 企业 的 战略 空间 就 
可 表示 为 S:= 10, ce), 即 包含 所 有 非 负 实数 , 其 中 一 个 代表 性 战略 5, 就 是 
企业 选择 的 产量 , 9; 盖 0。 世 许 有 的 读者 提出 特别 大 的 产量 也 是 不 可 能 的 , 
因而 不 应 包括 在 战略 空间 之 中 , 不 过 , 由 于 Q@ 之 a 时 , P(Q) =0, 任 一 企业 
都 不 会 有 qi >a 的 产 出 。 

要 全 面 表 述 这 一 博 穿 并 求 其 均衡 解 , 还 需 把 企业 i 的 收益 表示 为 它 自 
己 和 另 一 企业 所 选择 战略 的 函数 。 我 们 假定 企业 的 收益 就 是 其 利润 额 ,这 
样 在 一 般 的 两 个 参与 者 标准 式 博弈 中 , 参与 者 i 的 收益 wi(si, s;) 就 可 写 
为 :@ 


milga) = giplgt+g) -c=gl[la-(g+g)-e]. 


EP RANGEL, 在 一 个 标准 式 的 两 人 博弈 中 , 一 对 战略 (sr , s2 ) 如 是 纳 
什 均 衙 , 则 对 每 个 参与 者 is] 应 该 满足 


us), sf Jotuls, sf) - (NE) 


ERX S, 中 每 一 个 可 选 战略 ;; 都 成 立 , 这 一 条 件 等 价 于 :对 每 个 参与 
Ei, s? 必须 是 下 面 最 优化 问题 的 解 : 


mag usis sj). 


中 ”企业 不 选择 产 出 而 选择 价格 的 贝 特 兰 德 模型 (1883), 我 们 将 在 第 1.2.B 节 进 行 讨论 ;企业 
选择 产量 ,但 一 个 企业 先 选 ,并 可 被 另 一 企业 观察 到 的 斯 塔 克 尔 贝 里 模型 (1934) 我 们 将 在 第 2.1.B 
节 分 绍 。 最 后 ,在 第 2.3.C PRERE A E A R Friedman, 1971) 的 模型 , 其 中 十 诺 模 型 中 两 
个 企业 的 相互 影响 多 次 重复 发 生 。 

多 ”请 注 意 这 里 我 们 的 表示 有 一 个 小 的 变化 ,使 用 as sp 5) TSE ui(51, s2) ,两 者 都 表示 参与 
Hi ORB AAS SS RMS BR. SMC ERT x 人 博弈 中 ] 我 们 将 穿插 局 用 
这 两 种 表示 方法 。 
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在 古 诺 的 双 头 垄断 模型 中 , 上面 的 条 件 可 具体 表述 为 ;一 对 产 出 组 合 
Cal, qf ) 若 为 纳什 均衡 , 对 每 一 个 企业 i,q; 应 为 下 面 最 大 化 问题 的 解 : 


max nxi(gi, qj ) = mas qila = 


0S4 o 


Ü qj <a 一 c( 下 面 将 证 明 该 假设 成 立 ), 企业 i 最 优化 问题 的 一 阶 条 
件 既是 必要 条 件 , 又 是 充分 条 件 ; 其 解 为 


a= 4 (a-qj -0) ， {1.2.1) 


那么 , 如 果 产 量 组 合 (gr , gz ) 要 成 为 纳什 均衡 ,企业 的 产量 选择 必须 
满足 : 


* 1 . 
qf =7F(a- gq? >e) 


解 这 一 对 方程 组 得 


ARH ANT a 一 <, 满足 上 面 的 假设 。 

对 这 一 均衡 的 直观 理解 非常 简单 。 每 一 家 企业 当然 都 希望 成 为 市 场 的 
垄断 者 , 这 时 它 会 选择 q 使 自己 的 利润 x;(g;,0) 最 大 化 , 结果 其 产量 将 为 
垄断 产量 qn = {a - e)/2 并 可 赚 取 垄断 利润 ri(gi,0) = (a - c)?/4。 在 市 
场 上 有 两 家 企业 的 情况 下 ,要 使 两 企业 总 的 利润 最 大 化 ,两 企业 的 产量 之 和 
Gita 应 等 于 墓 断 产量 gw ,比如 qi= gm/2 时 就 可 满足 这 一 条 忻 。 但 这 种 
安排 存在 一 个 问题 ,就 是 每 一 家 企业 都 有 动机 偏离 它 : 因 为 垄断 产量 较 低 ， 
相应 的 市 场 价格 pC qm ) 就 比较 高 ,在 这 一 价格 下 每 家 企业 都 会 价 向 于 提高 
产量 , 而 不 顾 这 种 产量 的 增加 会 降低 市 场 出 清 价 格 ( 为 更 清楚 地 理解 这 一 
点 ,参见 图 1.2.1, 并 检验 当 企业 1 的 产量 为 g./2 时 , 企业 2 的 最 佳 产 量 并 
不 是 gm/2)。 在 古 诺 的 均衡 解 中 ,这 种 情况 就 不 会 发 生 ,两 企业 的 总 产量 要 
更 高 一 些 , 相应 地 使 价格 有 所 降低 。 习 题 1.4 是 关于 = 个 窒 头 垄断 企业 的 
情况 , 垄断 企业 一 方面 希望 提高 产量 , 但 又 不 愿 因此 而 使 市 场 出 清 价格 下 
降 , 请 分 析 这 相互 矛盾 的 两 方面 是 如 何 取得 均 街 的 。 
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TRU A RB RH TSS EL FRR, HE, 我们 还 可 以 通过 图 
形 求解 ,方法 如 下 。 等 式 (1.2.1) 给 出 的 是 针对 企业 j 的 均 本 战略 *” 时 企 
业 : 的 最 优 反 应 ,同样 的 方法 我 们 可 以 推导 出 针对 企业 1 的 任意 一 个 战略 
企业 2 的 最 优 反 应 ,和 针对 企业 2 任意 一 个 战略 企业 1 的 最 优 反 应 。 假 定 
企业 1 的 战略 ql 满足 9y<a -ec, 企 业 2 的 最 优 反应 为 


Ra(oD)= 寺 (aai-e) ， 
类 亿 地 ,如果 g< a ~ c, 则 企业 1 的 最 优 反 应 为 
Rila) = F(a 一 gz 一 c) . 


A 


(,a-<) 
Rq) 


Oa c)/2) AS 


(a —c)/2,0) 
BB 1.2.1 


@-c,0) A 


WE 1.2.1 所 示 , 这 两 个 最 优 反应 函数 只 有 一 个 交点 ,其 交点 就 是 最 优 
产量 组 合 (or , 92 )。 

求解 纳什 多 衡 还 有 第 三 种 方法 , 即 运 用 重复 噜 除 严 格 劣 战略 。 在 本 例 
中 ,这 一 程序 只 得 到 惟一 解 一 一 根据 附录 1.1.C 中 的 命题 A, 一 定 为 纳什 均 
衡 解 (oj , gq2 )。 完 整 的 过 程 需 要 无 限 次 剔除 ,每 一 步 都 从 两 个 企业 剩余 的 
战略 空间 内 剔除 一 个 区 间 , 我 们 在 这 里 只 讨论 前 两 步 。 第 一 步 , 蔓 断 产量 
gm 一 《a 一 c)/2 严格 优 于 其 他 任何 更 高 的 产量 , 即 对 任意 r > 0, x;( qm, a) 
>xi(gm+ 工 ;gy) 对 任意 的 9,20 都 成 立 。 证 明 如 下 :如 果 QS gut atg 
<a, MBA 


Tilam G)= 47 [ 3 - «| 
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| 
=n(gn 9) Xx(r+gq) 

HEME Q=¢,+ 2+ gg 之 a, 则 P(Q)=0, 生 产 较 低 的 产 出 就 会 提高 利 

润 。 第 二 步 ,在 高 于 gw 的 产量 被 剔除 后 , 产量 (a - <)/4 严格 优 于 任何 更 

低 的 产量 , 即 对 任意 在 0 到 (a - c)X4 之 间 的 z,ri[(a - 3/4, a] >a [Ca 

一 c)/4 一 ,gq;] 对 任意 在 0 到 {a 一 c)/2 之 间 的 9 都 成 立 , 证 明 如 下 ; 


nC 了 ,9) = [Me | 


4 4 
B 
C [lt 
=n(aneG)~2[25242-45] : 


经 过 以 上 两 步 别 除 , BEEE RS ED] FUT T Ca- c)/4 
Ba-c)/2 之 间 的 区 间 。 重 复 上 面 的 坟 程 可 以 把 剩余 战略 空间 限制 得 越 
来 越 小 。 到 达 极 限时 , 这 一 区 闻 就 成 为 一 个 点 gf = (a 一 c)/3。 
重复 剔除 严格 劣 战略 的 方法 也 可 以 用 图 形 来 描述 , 这 要 用 到 我 们 前 面 
的 一 个 观察 结论 (附注 1, 同 时 参见 1.3.A 中 的 讨论 ) : 当 且 仅 当 对 其 他 参与 
者 的 战略 ,无 法 作出 这 样 的 推断 , 使 某 一 战略 成 为 最 优 反 应 战略 , 该 战略 为 
严格 劣 战 略 。 由 于 本 模型 只 有 两 个 企业 ,我们 可 以 将 这 一 结论 化 为 : 当 且 仅 
当 没有 任何 gj Wiig, 成 为 企业 ; RER, qg 为 严格 劣 战 略 。 我 
们 仍 只 讨论 重复 剔除 过 程 的 前 两 步 。 第 一 ,对 企业 i 而 言 , 生产 超过 垄断 产 
Bq, = (a -<)/2 水 远 不 会 是 最 优 反应 。 我 们 以 企业 2 OR A 
例 来 证 明 这 一 点 :在 图 1.2.1 F, 当 qi =0 时 , Rog SF on, DE q: 的 增 
加 而 递减 。 即 对 任意 的 g, 0, 如 果 企 业 i 相信 企业 j 将 选择 gq, 企业 i 的 
最 优 反 应 就 必然 小 于 或 等 于 gm; 不 存在 这 样 的 gj, 使 i 的 最 优 反应 超过 gw o 


- 原文 如 此 , 亿 有 误 ,应 为 
GE zap- [5 a [Ea] 


snag] 一 评注 
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第 二 ,已 知 企业 产量 的 上 限 , 我 们 可 以 导出 企业 让 最 优 反 应 的 下 限 : 如 果 
g(a - 0)/2, WA Ri(g Sa ~ c)/4, mE 1.2.2 所 示 企 业 2 的 最 优 反 
应 .了 


fa 


{0, (a =¢)/2) 
,(a ~0)/4) 


a-0/2,0) @-e0)  ™ 


园 1.2.2 


和 上 面相 似 ,重复 这 一 剔除 过 程 就 会 得 到 单一 的 产量 g? = (a - c)/3。 

为 总 结 本 节 内 容 , 我 们 把 十 诺 模 型 稍 作 变动 , 使 重复 别 除 严格 劣 战 略 的 
程序 不 能 得 到 惟一 解 。 要 做 到 这 一 点 .只 需 在 上 面 的 双 头 董 断 模型 中 加 入 
一 个 或 更 多 的 企业 。 我 们 将 会 发 现 讨论 双 头 董 断 时 的 前 两 步 中 , 第 一 步 依 
然 成 立 ,但 是 这 一 过 程 也 只 能 中 止 于 此 了 。 也 就 是 说 , 当 企业 数目 多 于 两 个 
时 ,重复 刚 除 严格 劣 战略 只 能 得 到 非常 不 精确 的 预测 , 即 每 个 企业 的 产 出 不 
会 超过 垄断 条 件 下 的 产量 。( 这 与 图 1.1.4 非常 类 似 , 在 那里 这 一 方法 不 能 
剔除 挤 任 何 战 路 。) 

为 严谨 起 见 , 我 们 考虑 3 个 企业 的 例子 。 令 Q - ;表示 除 i 之 外 的 企业 
选择 的 产 出 之 和 , 并 令 nla Q-go at- 
a《 因 为 如 果 gi+ Q- Ze. M alg, Qi) = ~ cg), BABB ay = (a 
一 c)/2 RAF ERP, BEE x > 0. nilam Q-;) >il am 
+a, Q- DYRA Q-; 0 都 成 立 。 这 和 双 头 垄断 条 件 下 的 第 一 步 完全 相 
同 。 不 过 , 由 于 除 i 之 外 还 有 两 个 企业 ,而 q 和 gq 都 在 0 到 (a -cc)/2 之 
则 .我 们 对 Q- ;所 能 作 的 惟一 界定 就 是 在 0 和 a-c 之 间 。 这 也 意味 着 对 
企业 i 而 言 ,任何 g 20 都 不 是 严格 劣 战略 , 因为 对 在 0 到 (a 一 c)/2 间 的 
任意 g;, 都 存在 相应 的 在 0 到 a-e 癌 的 Q-;( 具 体 地 说 , Q- Sae 


中 ”这 两 步 证 明 帮 有 一 点 儿 不 完整 ,因为 我 们 没有 考虑 当 企业 i 拿 不 淮 g; 时 的 最 优 反 应。 设 
EE i 不 清楚 g, 但 相信 g 约 期 饪 值 为 ECq,)。 因 为 w,(g, 遇 ) 对 于 q 是 线性 的 ,这 种 条 件 下 企业 
i 不 确定 qj 时 的 最 优 反 应 简单 等 于 它 确定 企业 i 将 选择 Eq;) 时 的 最 优 反 应 一 一 书 中 已 有 这 样 的 
例子 。 
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th a 


2gi), 使 q RIEA BOQ. ;的 最 优 反应 战略 。 从 而 就 无 法 再 对 其 余 战 
略 空间 做 进一步 剔除 。 


1.2.B 矶 特 兰 德 的 双 头 垄断 模型 


下 面 我 们 讨论 双 头 垄断 中 两 个 企业 相互 党 争 的 另 一 模型 。 贝 特 兰 德 
(1883) 提 出 企业 在 竞争 时 选择 的 是 产品 价格 ,而 不 像 古 诺 模 型 中 选择 产量 。 
BCR LS = RAAT ERA ATTA NES, 这 一 点 十 分 重 
要 :参与 者 的 战略 空间 不 同 ,收益 函数 不 同 , 并且 (随后 就 可 清楚 地 看 到 ) 在 
两 个 模型 的 纳什 均衡 中 , 企业 行为 也 不 同 。 一 些 学 者 分 别 用 古 庶 均衡 和 贝 
特 兰 德 均衡 来 概括 所 有 这 些 不 同 点 ,但 这 种 提 法 有 时 可 能 会 导致 误解 : 它 只 
表示 古 诺 和 员 特 兰 德 博 弈 的 差别 , 以 及 两 个 博弈 中 均衡 行为 的 差别 , 而 不 是 
博 穿 中 使 用 的 均衡 概念 不 同 。 在 两 个 博弈 中 , 所 用 的 都 是 上 节 我 们 定义 的 
纳什 均衡 。 

我 们 考虑 两 种 有 差异 的 产品 (产品 完全 相同 的 情况 参见 习题 1.7)。 邵 
果 企 业 1 和 企业 2 分 别 选择 价格 p 和 p2, 消费 者 对 企业 i 的 产品 的 需求 
为 : 


ail dis j= a~ pit bp; ， 


HF 6>0, MARTEL i 的 产品 为 企业 j PRM PRT 
求 函数 在 现实 中 并 不 存在 , 因为 只 要 企业 j 的 产品 价格 足够 高 , 无 论 企业 i 
要 多 高 的 价格 ,对 其 产品 的 需求 都 是 正 的 。 后 面 将 会 讲 到 ,只 有 在 5<2 时 
向 题 才 有 意义 )。 和 前 面 讨论 过 的 古 诺 模型 相似 , 我 们 假定 企业 生产 没有 固 
定 成 本 ,并 且 边 际 成 本 为 常数 c,c <a, 两 个 企业 是 同时 行动 (选择 各 自 的 价 
格 ) 的 。 

和 上 节 相 同 , 要 寻找 纳什 均衡 首先 需要 把 对 问题 的 叙述 化 为 博弈 的 标 
淮 式 。 参 与 者 仍 为 两 个 ,不 过 这 里 每 个 企业 可 以 选择 的 战略 是 不 同 的 价格 ， 
而 不 再 是 其 产品 产量 。 我 们 假定 小 于 0 的 价格 是 没有 意义 的 ,但 企业 可 选 
择 任意 非 负 价格 一 一 比方 说 用 便士 标价 的 商品 , 并 无 最 高 的 价格 限制 。 这 
图 ,每 个 企业 的 战略 空间 又 可 以 表示 为 所 有 非 负 实数 Si = E0, cc), 其 中 企 
业 ;的 一 个 典型 战略 ; 是 所 选择 的 价格 三 二 0。 

我 们 仍 假定 每 个 企业 的 收益 函数 等 于 其 利润 额 , 当 企 业 ; 选择 价格 p;， 
其 竞争 对 手 选择 价格 p; 时 ,企业 i 的 利润 为 : 


nil Bi. pi) = ql pe plp cl= La- pit bp]lp-e]- 
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那么 ,价格 组 合 (pr? p FRAT, 对 每 个 企业 i, pr 应 是 以 下 最 优 
化 问题 的 解 : 


max xi( ps p7 )= max ba- p+ 6p; Ip;- cl] - 


055,50 p< 
对 企业 i 求 此 最 优化 问题 的 解 为 


b: =2 atte} +o) ‘ 


由 上 可 知 ,如 果 价 格 组 合 (pr , pr ) 为 纳什 均衡 ,企业 选择 的 价格 应 满足 


Pr =F (at op? +c) FM pz =Fla + opr te). 


解 这 一 对 方程 式 得 : 


pi pi =g: 
1.2.C 最 后 要 扮 仲裁 


许多 公共 部 门 的 职工 是 不 允许 罢工 的 ,这 时 ,有关 工资 的 分 歧 通过 具有 
约束 力 的 仲裁 解决 。( 棒 球 联 合 会 在 主要 的 机 制 上 更 满足 这 一 条 件 ,但 在 经 
济 上 的 重要 性 就 差 多 了 ) 很 多 其 他 争议 ,包括 医疗 事故 、 股 票 持 有 人 对 其 股 
票 经 纪 人 的 投诉 等 ,也 多 通过 伍 裁 解决 。 较 为 重要 的 仲裁 形式 有 两 类 ;协议 
仲 栽 和 最 后 要 价 仲裁 。 在 最 后 要 价 仲裁 中 ,争议 双方 各 自 就 工资 水 平 要 价 ， 
仲裁 入 选择 其 中 之 一 作为 仲裁 结果 ;在 协议 仲裁 中 , 与 之 不 同 的 是 ,仲裁 人 
可 自由 选 定 任意 工资 水 平 作为 仲裁 结果 。 本 节 我 们 根据 法 伯 (1982 ) 的 研 
FE, 导出 在 最 后 要 价 仲裁 模 型 处 于 纳什 均衡 时 , 博弈 双方 对 工资 水 平 的 要 
M 

很 定 参 与 争议 的 双方 一 为 企业 , 一 为 工会 ,争议 由 工资 而 起 。 博 弈 进行 
的 时 序 如 下 。 第 一 步 ,企业 和 工会 同时 开 出 自己 希望 的 工资 水 平 ,分 别 用 
wy 和 ao 表示 。 第 二 步 ,仲裁 人 在 二 者 之 中 选择 其 一 作为 结果 。《 与 许多 
被 称 为 静态 的 博弈 相似 , 它 其 实 属于 将 在 第 2 章 讨论 的 动态 博弈 ,只 不 过 这 
里 我 们 通过 对 仲裁 者 第 二 步行 为 的 假定 ,将 其 简化 为 企业 和 工会 之 间 的 静 
态 博 弈 ) 假 定 仲裁 人 本 身 对 工资 水 平 有 自己 认为 合理 的 方案 , H r 来 表示 
这 一 理想 值 , 进一步 假定 在 观测 到 双方 要 价 wy Mw, 后 ,仲裁 人 只 是 简单 


D 这 一 应 用 中 将 涉及 一 些 基本 的 概率 论 概 念 :累计 概率 分 布 . 慨 率 密度 函数 和 期 望 值 。 需 要 
时 我 们 会 给 出 简单 的 定义 和 解释 ;详细 资料 请 查阅 任何 一 种 介绍 顾 率 论 的 教材 。 
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(ar + we) /2 


1.2.3 


选择 距 x 最 为 接近 的 要 价 : 设 若 w< zwv( 这 与 我 们 的 直觉 一 致 , 后 面 将 会 
证 明 它 是 成 立 的 ). 如 果 r< (ror + zw)/2, 仲 裁 者 将 选择 zor; 如 果 r >l wy 
+ we)/2, 则 选择 w, ,参见 图 1.2.3, (BP c= (wy + zw。)/2 的 情况 出 现 
时 , 选择 哪 一 个 都 无 关 紧 要 ,不 妨 设 仲 裁 者 搓 硬 币 决 定 ) 仲 裁 者 知道 x ,但 参 
与 双方 都 不 知道 , 他们 相信 z 是 一 个 随机 变量 , 其 累积 分 布 函数 为 F), 
根 应 的 概率 密度 函数 为 x) 了。 根据 我 们 对 仲裁 者 行为 的 假定 , 如果 双方 
的 要 价 分 别 为 wy 和 xz 那么 双方 推断 wy 被 选中 的 概率 Prob! wr 被 选 | 和 
ws 被 选中 的 概率 Probi w, 被 选 | 分 别 表示 为 ; 


Prob | wy BORI = Probl z < A> Mey = pe ey 


Prob! w, 被 选 -1- FEL sy ， 
据 此 ,期 望 的 工资 水 平 为 
wey? Prob} wy 被 选 | + wu Probl ws 被 选 | 
= wp FOS) +t i POE) | . 


我 们 假定 企业 的 目标 是 使 期 望 工资 最 小 化 的 仲裁 结果 ,工会 则 设法 使 
其 最 大 化 。 若 双方 的 要 价 (w}, ww: ) 是 这 一 企业 和 工会 间 博 弈 的 纳什 均 


D Mla 小 于 任意 值 z “的 概率 可 才 示 为 F(x“ 》 并 且 对 ,导出 上 面 分 布 的 概率 窗 讶 为 
(a), 由 于 FCx") 是 一 个 概率 ,所 以 对 枉 意 工 ` 都 有 0 三 F(z”) 莹 1。 EAR >, A F 
Ce" SF( 2"), FR ME 2", f(r" V20, 


20_ IEF 


Bi, w; 必须 满足 :了 
min w+ PPE LWE + wl ree tery] 
me 

Bowl 必须 满足 : 


+w, tw, 
maxw} + Pee ey sw: fier Py] : 


IAT, BOTA LR RAS Cw; wi ) 必 须 满足 上 面 最 优化 问题 的 一 阶 
条 件 ,为 : 


wjtwi site: 


twi - wp Fr y= FC ) 


(wi -wjp ei) i- pees). 
CEMRE EEM AEN REO ek A RE SE 
完全 相同 ,其 右边 也 应 该 相等 , 这 意味 着 


wet ws m 
F( 3 = A 4 (1.2.2) 


即 , 双方 要 价 的 平均 值 一 定 等 于 仲裁 者 偏好 方案 的 中 值 。 把 (1.2.2) 代 入 任 
何 两 个 一 阶 条 件 之 一 可 得 


ol a EI (1.2.3) 


它 表 示 双 方 要 价 之 差 等 于 仲裁 者 偏好 方案 中 值 点 概率 密度 的 倒数 。 

为 更 好 地 从 直观 上 理解 这 一 比较 静态 结果 , 下面 我 他 考虑 一 个 具体 例 
子 。 设 仲裁 者 的 偏好 方案 遵从 期 望 值 为 m ,方差 o? 的 正 态 分 布 ,密度 函数 
为 


flx)= Fes | -zala my? 


《在 此 例 中 , 我 们 还 可 以 证 明 前 面 给 出 的 一 阶 条 件 同时 也 是 充分 条 件 。) 因 为 
正 态 分 布 在 其 期 望 值 两 便 的 分 布 是 对 称 的 , 因此 其 中 值 等 于 其 期 望 值 me 
这 时 (1.2.2) 就 成 为 


D 下面 在 建立 和 求解 企业 与 工会 的 最 优化 条 件 时 ,我 们 蟹 定 企业 的 出 价 总 闫 于 工会 的 要 价 。 
其 后 ,我 们 将 会 证 明 这 一 假定 的 正确 性 。 
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县 (1.2.3) 成 为 
Yo = 了 = fone? 
于 是 ,纳什 均衡 的 要 价 为 


和 


* xg? 
wj =m 2° 


FX, PLANS OT EY AA a dP RA A SA CB m4 ) 为 中 心 对 称 , E 
要 价 之 差 随 双方 对 仲裁 者 偏好 方案 不 确定 性 ( 即 o?) 的 提高 而 增 大 。 
对 这 一 均衡 结果 的 直观 理解 也 很 简单 , 博弈 的 每 一 方 都 需 进 行 权衡 , 一 
个 更 为 激进 的 要 价 ( 即 工会 更 高 的 要 价 或 企业 更 低 的 出 价 ) 一 旦 被 仲裁 者 选 
中 就 会 给 自己 带 来 更 高 的 收益 ,但 其 被 选中 的 可 能 性 却 会 相应 降低 (在 第 3 
SF 1 节 蜡 封 出 价 拍卖 中 我 们 还 会 看 到 相似 的 得 失 权 衡 : 较 低 的 价格 如 果 
中 标 就 会 获得 更 好 的 收益 , 但 却 会 减少 中 标的 机 会 )。 当 对 仲裁 者 偏好 方案 
的 不 确定 程度 增加 ( 即 o? 变 大 ) 时 ,双方 的 要 价 之 所 以 能 更 为 激进 ,是 因为 
一 个 更 激进 的 价格 与 仲裁 者 偏好 方案 有 较 大 差别 的 可 能 性 变 小 了 。 相 反 ， 
如 果 几 乎 不 存在 任何 不 确定 性 , 双方 都 不 敢 开 出 一 个 离 期 望 值 很 远 的 要 价 
来 ,因为 仲裁 者 选择 离 mm 最 近 的 方案 的 可 能 性 非常 大 。 


1.2.D 公共 财 问 题 


至 迟 失 休 庶 人 1739) 开 始 ,政治 哲学 和 经 济 学 家 已 经 认识 到 如 果 公民 只 
关注 个 人 福利 , 公共 物品 就 会 出 现 短缺 ,并且 公共 资源 也 会 过 度 使 用 。 今 
天 ,只 要 随便 看 一 下 地 球 的 环境 , 就 能 体会 到 这 一 观念 的 力量 。 哈 丁 
(Hardin, 1968) 被 广 为 引 用 的 论文 使 这 一 问题 引起 了 非 经 济 学 者 的 关注 。 
在 此 ,我 们 分 析 牧 场 的 例子 。 

考虑 一 个 有 n 个 村 民 的 村 庄 , 每 年 夏天 ,所 有 村 民 都 在 村 庄 公 共 的 
草地 上 放牧 。 用 & 表示 村 民 i 放养 羊 的 头 数 , 则 村 庄 里 羊 的 总 头 数 G 
Fait tg, 购买 和 照看 一 只 羊 的 成 本 为 c, < 不 随 一 户 村 民 拥 有 羊 
的 数目 多 少 而 变化 。 当 草地 上 羊 的 总 头 数 为 G 时 , 一 个 村 民 养 一 只 羊 
的 价值 为 w(G)。 由 于 一 只 羊 要 生存 , 至 少 需 要 一 定数 量 的 青草 , 草地 可 以 


22 FEE 


BORE BSA — TL Gma: G< Gmz 时 , 0(G)>0; 8 GEG mait, 
o(G)=0. A, 由 于 最 初 的 一 些 羊 有 充足 的 空间 放牧 ,再 加 一 只 不 会 对 
己 经 放养 的 羊 产 生 太 大 影响 ,但 当 草 地 上 放养 羊 的 总 数 已 多 到 恰好 只 能 维 
生 的 时 候 ( 即 G 恰好 等 于 Gu 时 ), 再 增加 一 只 就 会 对 其 他 已 经 放养 的 羊 带 
来 极 大 损害 。 用 公式 表述 为 :对 , G< Gay v(G)<0,8 v (G)<0, WE 
1.2.4 所 示 。 


Gaur G 
@ 1.2.4 
BAM AER AEE RE ES, PEE ESE 8 5) BH, 
HR ; 的 一 个 战略 就 是 他 选择 的 在 村 庄 草 地 上 放养 羊 的 数量 , go RER 
略 空间 为 [0, oo), 它 包含 了 可 以 给 村 民 带 来 收益 的 所 有 可 能 选择 ;[0, G ma) 
其 实 也 是 够 了 。 当 其 他 村 民 养 羊 数量 为 (g14,…, gi- Bice gw) 时 ,村 民 
i 放养 g; 只 羊 获得 的 收益 为 


Bi"U(g1t t+ giit gt isi ti +ga) cg - (1.2.4) 


这 样 ,着 (g? ,…,g; ) 为 纳什 均衡 , 则 对 每 个 村 民 i, 当 其 他 村 民选 择 ( gi ， 


el Sie Bn, g; 必须 使 (1.2.4) 最 大 化 。 这 一 最 优化 问题 的 
一 阶 条 件 为 


vlem tg?) tgw leit et )-c=0. (1.2.5) 


这 里 g ;代表 g? tet elit eatin ter ef 代入 (1.2.5), 并 把 
所 有 村 民 的 一 阶 条 件 加 总 , 然后 再 除 以 = 得 


UG +dLG' WG )-c=0 ， (1.2.6) 


其 中 , G "表示 gi +… +gx。 但 是 ,全 社会 的 最 优选 择 ,用 G” 表示, 应 满 
R 


max G'u(G)-G'c. 
omen 
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它 的 一 阶 条 件 为 
uG"+G"v(G")-c=0. (1.2.7) 
将 (1.2.6) 与 (1.2.7) 相 比较 可 知 ,8 G* > G”: 和 社会 最 优 的 条 件 相 
E, 纳什 均衡 时 放养 羊 的 总 数 太 多 了 。(1.2.5) 所 示 的 一 阶 条 件 表示 一 个 已 
经 放养 g; 只 羊 的 村 民 再 多 养 一 只 羊 的 收益 (或 更 严格 一 点 讲 , 是 再 多 养 " 一 
点 儿 " 羊 的 收益 )。 这 多 出 的 一 只 羊 的 价值 为 vle: + gt), 其 成 本 为 c。 对 
该 村 民 已 经 养 的 羊 的 损害 为 每 只 羊 v (gi + gs), 或 总 共 为 gio (gi + 
gio APR EET. 因为 每 个 村 民 只 考虑 他 们 自己 的 利益 , 并 


不 管 其 行为 对 其 他 村 民 带 来 的 后 举 , 这 就 出 现 了 (1.2.6) 中 的 二 G* v 
(G"), 而 非 (1.2.7) 中 的 G™ v G" )e 


1.3 ”理论 发 展 :混合 战略 和 均衡 的 存在 性 


1.3.A 混合 战略 


在 1.1.C 中 我 们 把 Si 定义 为 参与 者 可 以 选择 的 战略 集 ,并 且 对 每 一 
个 参与 者 is) 为 其 针对 另外 4 一 1 个 参与 者 所 选 战略 的 最 优 反 应 , 则 战略 
组 合 (s? on si VAWR BAA, B 


UST ry si- Srs Siap aSa ws os Sia ty Sio Siris Se) 
(NE) 
对 S; 中 每 一 s; 都 成 立 。 根 据 这 一 定义 ,下 图 所 示 * 狂 硬币 "的 博弈 是 不 
存在 纳什 均衡 的 。 


参与 人 2 
正面 背面 
正面 “hol 1-1 
参与 人 1 
背面 a 1 
MER 


O MRR GSG”, PLAT v <0, 0G" )2v(G"), Mesh, hF wv <0, A o> 
v(G20(G"), BE.G /mn<G*, 从 而 ,(1.2.6) 的 左边 将 严格 大 于 (1.2.7) 式 的 左边 ,但 这 
是 不 可 能 的 , 因为 两 式 的 右边 都 等 于 0。 
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在 此 博弈 中 , 每 一 参与 者 的 战 路 空间 都 是 (正面 ,背面 )。 为 理解 矩 
阵 表 中 所 列 参与 者 各 自 的 收益 , 设想 每 一 参与 人 拿 有 一 要 硬币 ,并 必须 
选择 是 出 正面 向 上 还 是 背面 向 上 。 若 两 枚 硬币 是 一 致 的 ( 即 全 部 正面 向 
上 或 全 部 背面 向 上 ), 则 参与 人 2 MESS A 1 的 硬币 ;如 果 两 枚 硬币 不 
一 致 (一 正 一 反 ), 参与 人 1 赢得 参与 人 2 的 硬币 。 在 此 博弈 中 , 没有 一 
组 战略 能 够 满足 (NE) 的 条 件 ,因为 如 果 参 与 者 的 战略 是 一 致 的 一 一 ( 正 
面 ,正面 ) 或 {背面 ,背面 ) 一 一 那么 参与 人 1 就 希望 能 改变 战略 , 如 果 参 
与 者 的 成 路 不 一 致 一 一 (正面 , 背面) 或 (背面 , 正面 ) 一 一 则 参与 人 2 将 
希望 能 改变 战略 。 

猜 硬币 博弈 一 个 非常 突出 的 特点 是 每 个 参与 者 都 试图 能 先 猿 中 对 方 的 
战略 。 这 一 类 博弈 在 扑克 、 棒 球 、 战 争 等 其 他 环境 中 也 经 常会 发 生 。 在 办 扑 
克 牌 赌博 的 博 穿 中 , 类 似 的 问题 是 如 何 决 定 使 诈 的 次 数 : 如 果 大 家 都 知道 参 
与 者 是 从 来 不 使 诈 的 ,那么 任何 时 蛋 当 i 下 很 高 的 赌注 时 他 的 对 手 就 会 
认输 ,但 这 又 使 得 i 偶然 使 诈 会 有 利 可 图 ; 另 一 方面 , 使 诈 次 数 过 多 亦 非 上 
筑 。 在 梯 球 比赛 中 , 假设 投球 手 既 可 以 挤 出 快 球 , X Ep RR, MBA 
球 手 能 够 击 中 任 柯 一 类 投球 的 前 提 是 , 他 能 正确 估计 到 投球 手 将 掷 出 哪 一 
类 球 。 与 之 相似 ,在 战争 中 , 假设 进攻 方 可 能 在 两 个 攻击 点 (或 两 条 进攻 路 
线 ,比如 “陆路 或 水 路 ") 中 选择 其 一 , 防御 方 可 以 抵御 来 自任 一 方向 的 攻击 ， 
但 也 只 在 它 正确 预测 到 进攻 路 线 的 前 提 下 。 

在 博弈 中 ,一 旦 每 个 参与 者 都 渴 力 猜测 其 他 参与 者 的 战略 选择 ,就 不 存 
在 纳什 均衡 (至 少 不 存 在 第 1.1.C 节 所 定义 的 纳什 均衡 ), 因为 这 时 参与 者 
的 最 优 行为 是 不 确定 的 ,而 博弈 的 结果 必然 要 包含 这 种 不 确定 性 。 现 在 引 
入 混合 战略 的 概念 ,我 们 可 以 将 其 解释 为 一 个 参与 者 对 其 他 参与 者 行为 的 
不 确定 性 。( 这 一 解释 被 豪 尔 绍 尼 (Harsanyi，1973 ) 深化 , 在 第 3.2.A 节 中 
我 们 将 进一步 讨论 到 ) 在 下 一 节 我 们 将 把 纳什 均衡 的 定义 扩展 到 包含 混合 
战略 , 从 而 可 以 分 析 诸如 猜 硬 币 . 扑 克 、 棒 球 及 战争 等 搏弈 的 解 出 现 的 不 确 
定性 。 

规范 地 表述 ,参与 者 i 的 一 个 混合 战略 是 在 其 战略 空间 S; 中 (一 些 或 
全 部 ) 战 略 的 概率 分 布 ,此 后 我 他称 Si 中 的 战略 为 的 纯 战 略 (pure strate- 
gics)。 对 本 章 所 分 析 的 完全 信息 同时 行动 博弈 来 说 ,一 个 参与 者 的 纯 战略 
就 是 他 可 以 选择 的 不 同行 动 ,例如 在 猜 硬 币 博 弈 中 , S; 内 含有 两 个 纯 战 略 ， 
分 别 为 正面 和 背面 , 这 时 参与 者 i 的 一 个 混合 战略 为 概率 分 布 (9,1- a), 
其 中 g 为 出 正面 向 上 的 概率 ,1- 9 为 出 背面 向 上 的 概率 , H 0 三 g 夺 1。 混 
合 战略 (0, 1) 表 示 参 与 者 的 一 个 纯 战略 , 即 只 出 背面 向 上 , 类似 地 , 汤 合 战略 
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《1,0) 表 示 只 出 正面 向 上 的 纯 战略 。 

作为 混合 战略 的 第 二 个 例子 , 请 回顾 图 1.1.1 所 示 博 弈 ,参与 者 2 有 三 
个 纯 战略 : 左 . 中 , 右 , 这 时 他 的 一 个 混合 战略 为 概率 分 布 (9，r，1- 9- 
r), 其 中 9 表示 出 左 的 概率 , > 表示 出 中 的 概率 ,1- g 一 r 表示 出 右 的 概 
率 ,和 前 面相 同 ,0 委 9 到 1, 且 这 里 还 应 满足 Sra] ROSgt rs. 在 此 
BAH, 混合 战略 (1/3, 1/3, 1/3) 表 示 参 与 者 出 左 、 中 、 有 的 概率 相同 , 而 
(1/2, 172,0) 表 示 出 左 、 中 的 概率 相同 , 但 绝 不 可 能 选择 出 右 。 和 在 所 有 情 
况 下 一 样 ,参与 者 的 一 个 纯 战 略 只 是 混合 战略 的 一 种 特例 , 例如 参与 者 2 只 
出 左 的 纯 战略 可 表示 为 混合 战略 (1,0, 0)。 

更 为 一 般 地 ,假设 参与 者 2 有 K 个 纯 战 略 : S: = isit scl, MBSE 
i 的 一 个 混合 战略 是 一 个 概率 分 布 ( pa, …: pix), 其 中 加 表示 对 所 有 大 = 
Lo, K, 参 与 者 i 选择 战略 sa 的 概率 , 由 于 各 是 一 个 概率 ,对 所 有 上 = 1， 
K, H 0S pal H pate + pxe=1. RIN p BREF S, 的 任意 一 
个 混合 战略 ,其 中 包含 了 选择 每 一 个 纯 战 略 的 概率 ,正如 我 们 用 s: 表示 Si 
内 任意 一 个 纯 战 略 。 


定义 ”对 标准 式 铺 弈 G = 1S1,…, Spiti … ,unl ,假设 Si= Isa 
sais WA, B58 i 的 一 个 混合 战略 为 概率 分 布 p; = ( pa,…, pix), 其 中 
MPA k51, +, KOS paSt, H pa +--+ + prle 


作为 本 节 的 一 个 小 结 ,我 们 简单 地 回顾 一 下 第 1.1.B 节 中 介绍 的 严格 
劣 战略 , 并 说 明 混 合 战略 对 那里 的 论证 所 起 的 潜在 作用 。 当 时 讲 到 , 如 果 战 
略 s; 为 严格 劣 战略 ,那么 参与 者 i 不 可 能 作出 这 样 的 推断 (针对 其 他 参与 
者 的 战略 选择 ), 他 的 最 优 反应 战略 会 是 s:。 如 果 我 们 引入 混合 战略 ,就 可 
证 明 其 逆 命 是 ;如 果 ( 针 对 其 他 参与 者 的 战略 选择 ) 参 与 者 i 都 不 可 能 作出 
这 样 的 推断 , 即 其 战略 s; 会 成 为 最 优 反 应 战略 , 则 一 定 存在 另 一 战略 严格 
TOF spo? 图 1.3.1 和 图 1.3.2 所 示 博 弈 说 明了 如 果 我 们 只 讨论 纯 战 略 ,这 
一 递 命题 是 不 成 立 的 。 


T 皮尔 斯 (Pearce, 1984) 在 两 人 博弈 中 证 明了 这 一 结论 , HERES S HZ MARS a e fe 
许 相关 的 条 件 下 ,该 结论 在 = 人 博弈 中 同样 成 立 , 即 必须 允许 参与 者 i 对 参与 者 ; 行动 的 推断 与 其 
对 参与 者 行动 的 推断 相关 。 奥 受 (1987}) 提 出 这 样 的 相关 性 在 ; 的 推断 中 是 非常 自然 的 , 即使 在 j 
和 点 完全 独立 地 作出 选择 的 情况 下 。 例 如 , i 可 能 会 知道 和 上 都 要 去 商学 院 , 或 也 许 去 同一 所 商 
学 院 , 但 也 许 不 会 知道 那里 面 教授 杆 么 课 积 。 
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1.3.1 


B 1.3.1 PRH, ~ TE A OES Pe TR E 
使 这 个 纯 战 略 并 不 严格 劣 于 其 他 任何 一 个 纯 战 略 。 在 这 一 博弈 中 , 针对 参 
与 人 1 对 参与 人 2 可 能 行动 所 作出 的 任何 推断 (9,1- gq),1 的 最 优 反应 要 
么 是 TCE q>1/2 h), EALE ME g 魏 172 时 ), 但 不 会 是 B, 虽 然 人 本 或 
M 都 不 严格 优 于 5。 这 里 的 关键 在 于 BAT AM 的 一 个 混合 战略 的 严格 
劣 战略 ;如 果 参 与 者 1 以 1/2 的 概率 出 T, 以 1/2 的 概率 出 M, 则 其 期 望 收 
益 为 3/2, 不 管 2 将 会 选择 什么 ( 纯 的 或 混合 的 ) 战 略 , 3/2 都 大 于 选择 B 时 
将 得 到 的 收益 1。 这 个 例子 说 明了 在 “寻找 另外 一 个 严格 优 于 的 战略 "时 ， 
混合 战略 所 起 的 作用 。 


参与 人 2 


L R 
iT 3, - 0, — 

参与 人 1 M 0, - 3 
B 2- ioe 
1.3.2 


图 1.3.2 EA Te BS SAY A EL — TY I 
应 ,即使 这 一 纯 战 略 并 不 是 对 方 任何 一 个 纯 战 略 的 最 优 反 应 。 在 此 博弈 中 ， 
对 参与 人 2 的 纯 战 略 LAR 来 说 ， 参 与 人 1 的 最 优 反 应 都 不 是 8,， WB 
却 是 针对 参与 人 2 的 混合 战略 {9，1- 9)， 当 1/3<q<2/3 时 参与 人 1 
的 最 优 到 应 。 这 一 例子 说 明了 混合 战略 在 “参与 者 可 能 持 有 的 推断 ”中 
的 作用 。 


1.3.B 纳什 均衡 的 存在 性 


本 节 讨论 和 纳什 均衡 的 存在 性 相关 的 几 个 问题 。 第 一 , 我 们 把 第 
1.1.C 节 中 纳什 均衡 的 定义 扩展 到 包含 混合 战略 的 情况 ;第 二 , 我 们 应 用 这 
一 扩展 后 的 定义 求解 猿 硬 币 村 弈 和 性 别 成 博弈 的 纳什 均衡 ;第 三 , 我 们 用 图 
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示 的 方法 证 明 任何 一 个 参与 者 有 两 个 纯 战 略 的 两 人 博弈 都 存在 纳什 均衡 
(可 能 包含 了 混合 威 略 ); 最 后 ,给 出 并 讨论 纳什 定理 (1950), 它 保证 了 在 任 
和 何 有 限 博弈 ( 即 有 限 个 参与 者 , 并 且 每 个 参与 者 可 选择 的 纯 战 略 有 限 的 所 有 
博弈 ) 中 ,都 存在 纳什 均衡 ( 仍 可 能 会 包含 混合 战略 )。 

回顾 第 1.1.C 节 给 出 的 纳什 均衡 定义 ,保证 了 每 一 参与 者 的 纯 战 略 都 
是 其 他 参与 者 纯 战略 的 最 优 反 应 战略 。 为 把 这 一 定义 扩展 到 包含 混合 战 
略 的 情况 ,我们 只 需要 求 每 一 参与 者 的 混合 战略 是 其 他 参与 者 混合 战略 
的 最 优 反应 。 由 于 任何 纯 战 略 都 可 表示 为 混合 战略 一 一 只 要 令 该 参与 
者 所 有 其 他 纯 战 略 出 现 的 概率 等 于 0 一 一 扩展 后 的 定义 完全 包括 了 前 
一 定义 。 

对 参与 者 i 来 讲 ,参与 者 ; 的 混合 战略 代表 了 他 对 将 选择 战略 的 不 
确定 性 , 并 据 此 计算 参与 者 i 对 ; 混合 战略 的 最 优 反 应 。 我 们 先 以 猜 硬 币 
博弈 为 例 , 假定 参与 者 1 推断 参与 者 2 会 以 9 的 概率 出 正面 ,以 1- 9 的 概 
率 出 背面 , 亦 即 参 与 者 1 推断 参与 者 2 将 使 用 湿 合 战略 (9g,1- 9*)。 据 此 推 
断 ,参与 者 1 出 正面 可 得 的 期 望 收益 为 a( 一 1)+ (1-g)*1=1-29, 出 背 
面 的 期 望 收益 为 ge'1+(1-9)(-1=2g-1。 由 于 当 且 仅 当 9<172 时 ,1 
-2g>2g ~1, 则 gq<1/2 时 ,参与 者 1 的 最 优 纯 战略 为 出 正面 ;g > 1/2 时 
为 出 背面 ; 当 g = 1/2 时 ,参与 者 1 出 电 一 面 都 是 无 差异 的 。 余 下 的 就 是 参 
与 者 1 可 能 的 混合 战略 反应 。 

令 (r,1-z) 表 示 参 与 者 1 的 混合 成 略 ,其 出 正面 的 概率 为 >, 对 任意 0 
到 1 之 间 的 4, 现在 我 们 计算 的 值 ,用 "(4q) 表 示 , 从 而 使 ( >,1- -) 为 参 
与 者 2 选择 (q, 1 一 9) 时 参与 者 1 的 最 优 反 应 ,其 结果 可 以 表示 为 图 1.3.3。 
当 参 与 者 2 选择 (e,1- 9) 时 ,参与 者 1 选择 (+r,1 一 7+) 的 期 望 收 益 为 ; 

ra(-1)+rtl- gq)t+(-r)g1+t dra) (-) 
=(2g+1)+r(2—4g) (1.3.1) 
其 中 ,rq 是 (正面 , EM) ee. rO- gs) 是 (正面 , 背面 ) 的 概率 , 如 此 等 
等 .0 由 于 参与 者 ! 的 期 望 收益 在 2 一 49 >0 时 随 + 递增 ;在 2 一 4c<0 mt 
r BR, 则 如 果 g 之 1/2, 参与 者 1 的 最 优 反 应 为 + =1( 即 出 正面 ); 如 果 g> 
1/2, 参与 者 1 的 最 优 反应 为 -=0( 即 出 背面 ), 如 图 1.3.3 所 示 r+" (q) PEt 


人 中” 如果 概率 (4 BB) = RCA) HEB) A AB 是 独立 的 。 那么 ,在 用 rg 表示 1 
出 正面 同时 2 也 出 正面 时 , 我 们 已 隐 合 了 假定 + 和 2 相互 独立 地 进行 选择 , 这 与 我 们 对 同时 行动 博 
穿 的 限定 是 一 致 的 。 参 见 身受 (1974) 对 丰 关 均衡 的 定义 , 它 应 用 于 参与 者 的 选择 可 以 相关 的 博弈 。 
{《 由 于 参与 者 在 选择 战略 之 前 观察 到 一 个 随机 结果 , Hine if EM LATHE BN) 
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水 平 虚线 。 这 一 表述 比 上 面 非常 相近 的 表述 条 件 要 强 :那里 我 们 只 考虑 纯 
战略 ,并 发 现 如 果 g< 1/2, 正 面 为 最 优 纯 战 略 ,如 果 g > 1/2, 背面 为 最 优 纯 
战略 ;这 里 我 们 考 下 所 有 的 纯 战 略 和 混合 战略 ,同样 发 现 如 果 g<1/2, 正面 
是 所 有 战略 (包含 纯 战 略 和 混合 战略 ) 中 的 最 优选 择 , 如 果 q > 1/2, 背面 是 
所 有 战略 中 最 优 的 。 


《背面 
1/2 1 og 


《背面 ) CEM) 
图 1.3.3 


当 g 一 1/2 时 ,参与 者 对 (eg,1- 4) 最 优 反 应 的 性 质 有 所 变化 。 前 面 已 
经 握 到 ,在 q= 172 时 ,参与 者 1 选择 纯 战 略 正面 或 背面 是 无 差异 的 。 而 
且 , 因 为 参与 者 1 在 (1.3.1) 中 的 期 望 收益 在 g = 1/2 时 与 r 无 关 , 所 有 混 
全 战略 (7 ,1 一 7) 对 1 都 是 无 差异 的 。 也 就 是 说 , 当 g =1/2 时 ,对 于 0 到 1 
之 间 的 任何 r RARECO L- ORE 1 一 q) 的 最 优 反 应 。 那 么 ,+* 
(1/2) 就 是 [0, 1] 间 的 整个 区 间 , 即 图 1.3.3 所 示 Cg PRE. Æ 
第 1.2.A 节 分 析 古 诺 模型 时 , 我 们 称 r; (gj) 为 企业 i 的 最 优 反应 函数 。 在 
这 里 ,因为 存在 一 个 g 的 值 ,使 ~”(a) 有 不 止 一 个 解 . 我 们 称 r’ ) 为 参与 
者 1 的 最 优 反 应 对 应 (best-response correspondence)。 

为 在 更 为 一 般 的 条 件 下 推导 出 参与 者 i 对 参与 者 j 混合 战略 的 最 优 反 
应 , 进一步 给 出 扩展 的 续 什 均衡 的 正式 定义 , 我 们 首先 分 析 两 个 参与 者 的 情 
况 ,从 而 可 以 通过 最 简单 的 方式 说 明 主 要 思想 。 令 了 表示 Si 中 包含 纯 战 略 
的 个 数 , K 表示 Ss 包含 纯 战略 的 个 数 , 则 S = jst syl S25 tsa, 
sox}, BAND suv 和 sz 分 别 表示 Si S2 中 任意 一 个 纯 战 略 。 

如 果 参 与 者 1 推断 参与 者 2 将 以 (pa,…, pz4) 的 概率 选择 战略 (sz1， 
1, Poe), MBSE 1 选择 纯 战略 :的 期 望 收 益 为 : 
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K 
D) Paater(sijs sa) ， (1.3.2) 
ma 

且 参 与 者 1 选择 混合 战略 Pi pn,…, pu) 的 期 望 收 益 为 : 


1 x 
vi (Pi, P2) = Dul Dy pauls sa) ] 
frs 


m 


eK 
= D D pu punili sae) - (1.3.3) 


其 中 , pi x pa 表示 参与 者 选择 su 且 参 与 者 2 选择 or, 的 概率 ,根据 
(1.3.3), 参与 者 1 选择 混合 战略 P, 的 期 望 收 益 , 等 于 按 (1.3.2) 给 出 的 每 
一 个 纯 战 略 list os say) 的 期 望 收益 的 加 权 和 , 其 权重 分 别 为 各 自 的 概率 
(pi pu) ,那么 ,参与 者 1 的 混合 战略 (pu,-…, p 要 成 为 他 对 参与 者 
2 战略 Po 的 最 优 反应 ,其 中 任何 大 于 0 的 py 相对 应 的 纯 战 略 必须 满足 ， 


k K 
Paks 20) = 2s zkel(s 5 +528) 


对 Si 中 每 一 个 ;1; 都 成 立 。 这 表明 ,一 个 混合 战略 要 成 为 P 的 最 优 反应 ， 
混合 战略 中 每 一 个 概率 大 于 0 的 纯 战 略 本 身 也 必须 是 对 Ps 的 最 优 反 应 。 反 
过 来 讲 , 如 果 参 与 者 1 有 = 个 纯 战 略 都 是 Pz 的 最 优 反应 , 则 这 些 纯 战 略 全 部 
或 部 分 的 任意 线性 组 合 (同时 其 他 纯 战 略 的 概率 为 0) 形成 的 混合 战略 同样 
是 参与 者 1 对 P 的 最 优 反应 。 

为 给 出 扩展 的 纳什 均衡 的 正式 定义 , 我 们 还 需要 计算 当 参 与 者 1 和 2 
分 别 选择 混合 战略 Pl 和 P 时 参与 者 2 的 期 望 收 益 。 如 果 参 与 者 2 推断 参与 
者 1 将 分 别 以 (p11,…, Bay) 的 概率 选择 战略 1511,…, sat, 则 参与 者 2 分 别 
以 概率 (pz1,…, Don) 选择 成 略 (sz t, s2) 时 的 期 望 收益 为 


K 


y 
wat Pi. P2) = Dal X pueal sys, soe) ] 
K 


1 


im X Sy py + Partal Sijs S24) + 


fim 
在 给 出 vi(P1, Pa) 和 wz( Pa, Po) 后 ,我 们 可 以 重新 表述 纳什 均衡 的 必要 条 
件 . 即 每 一 参与 者 的 混合 战略 是 另 一 参与 者 混合 战略 的 最 优 反 应 :一 对 混合 
RE (PY, P2 ) 要 成 为 纳什 均衡 , PY 必须 满足 


o(PL, PZ) = wP, PZ). (1.3.4) 
对 Si 中 战略 所 有 可 能 的 概率 分 布 Pi 都 成 立 , 并 且 P2 必须 满足 
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val Pr PT )2u PY. P2) ， (1.3.5) 
对 S, 中 战略 所 有 可 能 的 概率 分 布 P: 都 成 立 。 


定义 ”在 两 个 参与 者 标准 式 博弈 G = |S, S2; st u:i P, 混合 战略 
(Pi, PP? ) 是 纳什 均衡 的 充 要 条 件 为 :每 一 参与 者 的 混合 战略 是 另 一 参与 者 
混合 战略 的 最 优 反 应 , 即 (1.3.4) 和 (1.3.5) 必 须 同时 成 立 。 


下 面 我 们 用 这 一 定义 分 析 狂 硬币 博 守 和 性 别 战 博弈 ,为 此 , 我 们 运用 图 
1.3.3 中 介绍 的 图 示 法 , 把 参与 者 i 对 参与 者 7 混合 战略 的 最 优 反应 在 图 上 
表示 出 来 。 为 完成 图 1.3.3 的 内 雁 , 还 需 计 算 最 优 的 4 值 ,用 gs”"(r) 表 示 ， 
从而 使 (g,1 一 g) 成 为 参与 者 2 对 参与 者 1 战略 (>,1- ~) 的 最 优 反 应 。 结 
果 如 图 1.3.4 所 示 , WE r*<1M2, 则 2 的 最 优 反应 为 背面 ,于 是 yg" (r) =0; 
相似 地 ,如 果 r>1/2, M 2 的 最 优 反应 是 正面 ,于 是 se"(r) = 1。 如果 = 
1/2, 则 不 仅 参 与 者 2 出 正面 和 出 背面 是 无 差别 的 , 而 且 对 其 所 有 混合 战略 
CaL- gq) 也 都 完全 相同 ,于 是 a (1/2) 为 整个 区 间 [0, 1]。 


CAD 


《背面 》 《正面 ) 
图 1.3.4 


把 图 1.3.4 的 纵 轴 和 模 轴 互 换 并 旋转 ， 我 们 得 到 图 1.3.5。 单 纯 表 示 
参与 者 2 对 参与 者 1 混合 战略 的 最 优 太 应 ， 图 1.3.5 不 如 图 1.3.4 EWE 
观 ， 但 它 可 与 图 1.3.3 合并 成 图 1.3.6。 图 1.3.6 和 第 1.2.A 节 分 析 古 庶 
模型 时 的 图 1.2.1 相 类 似 ， 正 如 那里 的 最 代 挨 应 函数 r Ca) 和 ri (92) 
的 交点 确定 了 古 诺 博 弈 的 纳什 均衡 ， 在 这 里 最 优 反 应 对 应 >” Cg) Bg” 
(r》 的 交点 给 出 了 猜 硬币 博弈 的 混合 战略 纳什 均衡 : 如 果 参 与 者 i 的 战 
EE (1/2，1/2), 则 参与 者 j 的 最 优 反 应 为 《1/2，1/2)， 它 满足 纳什 均 
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SHER, 
《正面 》 
(frig) 
(背面 {正面 》 
图 1.3.5 
GERD 
1/2 
(背面) = = 
1/2 1 q 
(背面 ) 《正面 ) 
图 1.3.6 


应 该 强调 的 是 ,这 样 一 个 混合 战略 纳什 均衡 并 不 是 建立 在 任何 参与 者 
扔 硬币 、 搓 仍 子 或 其 他 随机 选择 行为 的 基础 之 上 , 我 们 可 以 把 参与 者 ; 的 混 
合 战 略 解释 为 参与 者 ; 对 参与 者 ; 将 会 选择 哪 一 个 ( 纯 ) 战 略 的 不 确定 性 。 
例如 在 棒球 比赛 中 , 投球 手 也 许 是 基于 以 往 投球 的 成 功率 决定 是 投 快速 直 
线 球 还 是 投 曲 线 球 。 如 果 击 球 手 了 解 投球 手 是 如 何 选择 的 ,但 并 不 能 观察 
到 他 以 往 的 成 功率 ,那么 击 球 手 就 可 能 会 推断 投球 手 投 出 快 球 和 投 出 直线 
球 的 可 能 性 是 相等 的 。 这 时 我 们 把 击 球 手 的 推断 表示 为 投球 手 采取 混合 战 
咯 (1/2, 1/2), 而 事实 上 投球 手 是 基于 击 球 手 所 不 了 解 的 信息 选择 一 个 纯 战 
略 。 更 为 一 般 地 讲 , 我 们 可 以 理解 为 参与 者 j 被 赋 于 了 一 小 点 儿 内 部 信息 ， 
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基于 他 所 掌握 的 内 部 信息 ,参与 者 j EME TARRAK, T 
过 ,由 于 参与 者 ; 并 不 能 观测 到 |; 的 私人 信息 , i 并 不 能 确定 7 的 选择 , 我 们 
用 j 的 混合 战略 表示 的 这 种 不 确定 性 。 在 第 3.2.A 市 , 我们 还 将 为 这 种 
对 混合 战略 的 解释 提供 更 为 正式 的 表述 。 

作为 混合 战略 纳什 均衡 的 第 二 个 例子 ， 考 虑 第 1.1.C 节 中 的 性 别 战 
博弈 ， 令 《gq，1 - 9) 为 帕 特 的 一 个 混合 战略 ， 其 中 他 选择 歌剧 的 概率 为 
9， 且 令 〈《r，1- r) 为 克 里 斯 的 一 个 混合 战略 ， 其 中 他 选择 歌剧 的 概率 
为 ~。 如 果 帕 特 的 战略 为 (9,1 - 9), 则 克 里 斯 选 择 歌剧 的 期 望 收益 为 Yx2 
+(1-9)x0=29, 选 择 源 击 的 期 望 收益 为 9x0+(1-9)x1=1-9。 有 从 
而 ,在 q>1/3 时 , 克 里 斯 的 最 优 反 应 为 歌剧 ( 即 -=1)39<1/3 时 , 克 里 斯 
的 最 优 反 应 为 拳击 ( 即 + =0);4q=1/3 时 ,任何 可 行 的 + 都 是 最 优 反 应 。 类 
似 地 ,如果 克 里 斯 的 战略 为 (7,1 一), 则 帕 特 选择 歌剧 的 期 望 收益 为 + Xx1 
+ {1 一 r)x0=7, 选 择 源 击 的 期 望 收益 为 -x0+ (1 一 r)x2= 2(1 一 r)。 
从 而 ,7+>2/3 时 , 犀 特 的 最 优 反 应 是 歌剧 ( 即 g = 1);r<2/3 Bt, WATE 
优 反应 是 拳击 ( 即 g =0),r =2/3 时 ,任何 可 行 的 q 值 都 是 最 优 反 应 。 如 图 
1.3.7 所 示 , 最 忧 反应 对 应 的 交点 之 一 , 即 帕 特 的 江 合 战略 (9g,1 一 gq)= 
(1/3,2/3) 与 克 里 斯 的 混合 战略 (r,1 一 +)= (2/3, 1/3) 就 是 原 博弈 的 一 个 
纳什 均 街 。 


et) 


Ge) (RE) 
1.3.7 


本 例 和 图 1.3.6 的 不 同 之 处 在 于 ,后 者 两 位 参与 者 的 最 优 反应 对 应 只 
有 一 个 交点 ,图 1.3.7 中 Cg) 和 9g"(r) 有 三 个 交点 ;(g~=0,r=0)、(q= 
1, r=1) 及 (q=1/3,r=2/3)。 另 外 两 个 交点 分 别 代 表 了 第 1.1.C 节 讲 过 
的 两 个 纯 战 略 纳 什 均衡 (拳击 、 源 击 ) 和 { 歌 剧 ,歌剧 )。 
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在 任何 博弈 中 , 一 个 纳什 均衡 (包括 纯 战 略 和 混合 战略 均衡 ) 都 表现 为 
参与 者 间 最 优 反应 对 应 的 一 个 交点 ,即使 该 博弈 的 参与 者 在 两 人 以 上 ,或 有 
些 或 全 部 参与 者 有 两 个 以 上 的 纯 战 略 。 不 过 遗憾 的 是 ,惟一 一 种 可 以 用 图 
形 简明 表示 出 参与 者 之 间 最 优 反应 对 应 的 博弈 , 就 是 上 面 介绍 的 每 个 参与 
者 只 有 两 个 纯 战 略 的 两 人 博弈 。 下 面 我 们 用 图 示 法 论证 任何 这 种 两 人 博弈 
都 存在 纳什 均衡 (可 能 包含 了 混合 战略 )。 


参与 人 点 a 
A 
F PF w,- 
1.3.8 


考虑 图 1.3.8 给 出 的 参与 者 1 的 收益 情况 。z 和 =, y Mw SAA 
对 六 小 对 博 穿 的 结果 十 分 重要 ， 由 此 可 以 分 为 以 下 四 种 主要 情况 : G) x 
>z Hy>w, Gi) c<z By<w, (iii) xr>z Hy<w, liv) r<z Ay 
>>w。 我 们 首先 讨论 这 四 种 主要 情况 ， 然 后 再 分 析 涉 及 x = = Ry = w 时 
的 情况 。 


1.3.9 


对 参与 者 1, EARP, LPB FE ERROR, FEEFEE. 

根据 前 面 讲 过 的 严格 劣 战略 定义 ; 当 且 仅 当 参与 者 i( 对 其 他 参与 者 所 选择 
的 战略 ) 不 能 作出 这 样 的 推断 , 使 选择 战略 s; 成 为 最 优 反 应 , 则 si 为 严格 劣 

战略 。 因 此 , 如果 (gq, 1 9) 是 参与 者 2 的 一 个 混合 战略 , 其 中 g 为 2 选择 

左 的 概率 ,那么 在 情况 Gi) 中 ,没有 g 能 使 参与 者 1 选择 下 成 为 最 优 ,并且 在 

请 况 (i 刘 中 ,没有 9 能 使 1 选择 上 成 为 最 优 。 令 (>,1- ~) 表 示 参 与 者 1 的 

一 个 混合 战略 ,其 中 是 1 选择 上 的 概率 , 我们 可 以 在 图 1.3.9 中 分 别 表 
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ARORA OAR Gi) TARR. CER AT, 最 忧 反 
BMPR BR a 值 使 得 参与 者 1 有 多 个 最 
HRB.) 


r 
Ch) 4 


CF) CF) 


HA 1.3.10 


在 情况 {ii) 和 情况 (iv) 中 , 上 和 下 都 不 是 严格 劣 战略 ,那么 ,必定 对 某 些 
a 值 ,选择 上 是 最 优 的 , 对 另 一 些 gq 值 ,选择 下 是 最 优 的 。 令 9 lwy) 
(zx+w 一 3 那么 在 情况 (ii 中 ,>e 时 上 是 最 优 的 , ge< 9 时 下 最 优 ; 
而 在 (iv) 中 则 相反 。 在 两 种 情况 下 , g = q 时 , 任何 可 行 的 > 都 是 最 优 的。 
这 两 种 情况 的 最 优 反 应 对 应 由 图 1.3.10 给 出 。 

由 于 z=x 时 ,gq =1, 而 y=w 时 ,gq =0. 所 有 包含 =z= 或 ?= 也 的 
情况 下 ,最 优 反 应 对 应 将 呈 “ 工 " 状 ( 即 单 位 正方 形 中 相 邻 的 两 条 边 ) 我 们 可 
设想 图 1.3.10 中 (ii) 或 (iv) ,在 go =O R q =1 时 的 情况 。 

在 图 1.3.8 中 分 别 加 入 任意 的 参与 者 2 的 收益 值 ,经 过 与 上 面 类 似 的 
计算 可 得 同 祥 的 四 个 最 优 反应 对 应 , 只 不 过 与 图 1.3.4 相同 , 水平 轴 代表 r 
值 ,而 纵 轴 代表 g Eo OA 1.3.4 到 1.3.5 同样 的 处 理 ,旋转 这 四 个 图 形 的 
坐标 系 , 可 以 得 到 图 1.3.11 和 图 1.3.12( 在 图 1.3.12 中 ,对 ”的 定义 与 图 
1.3.10 F g M). 

决定 性 的 一 点 在 于 ,给 定 参 与 者 1 的 四 种 最 优 反 应 对 应 的 任何 一 种 , 即 
图 1.3.9 或 图 1.3.10 中 的 任何 一 条 ~” (9), 及 参与 者 2 的 任何 四 种 之 一 ， 
BPP 1.3.11 或 图 1.3.12 中 的 任何 一 条 qa*《r), 这 一 组 最 优 反 应 对 应 至 少 
有 一 个 交点 ,于 是 博弈 至 少 有 一 个 纳什 均衡 , 对 16 种 可 能 的 最 优 反应 对 应 
组 合 情 况 进行 逐一 检验 ,我 们 留 在 习题 中 进行 。 这 里 只 定性 地 给 出 可以 得 
到 的 结论 。 可 能 出 现 的 情况 有 :(1) 惟 一 的 纯 战 略 纳什 均衡 , (2) 人 惟一 的 混合 
战略 纳什 均衡 , (3) 两 个 纯 战 略 纳什 芍 衡 和 一 个 混合 战略 纳什 均衡 。 前 面 讲 
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过 的 图 1.3.6 的 猜 硬 币 博弈 是 第 二 种 情况 的 一 个 例子 ,图 1.3.7 的 性 别 战 
博客 是 第 三 种 情况 的 一 个 例子 。 四 徒 困境 则 属于 第 一 种 情况 , 它 是 由 r+” 
Cq) 的 (0D 或 (i 和 q Cr RIG) RGD TEMI. 

r 


《上 ) 1 


(E) 1 


Tm) CF) 


(TF) 


W Gi) 


1.3.12 


本 节 的 最 后 ,我们 讨论 在 更 为 一 般 的 博弈 中 纳什 均衡 的 存在 性 。 如 果 
上 面 关于 两 人 两 个 纯 战 略 博 弈 的 论证 不 使 用 图 示 的 方法 ,而 用 数学 方法 , 则 
可 以 适用 于 一 般 的 在 意 有 限 战略 空间 的 n 人 博弈 。 


定理 《纳什 , 1950): 在 ”个 参与 者 的 标准 式 博弈 G = 1Si1,…, Spui 


O 包 合 z=z 或 y= ww 时 的 情况 并 不 违背 一 组 最 优 反 应 对 应 至 少 有 一 个 交点 的 结论 。 相 反 ， 
除 书 中 讲 到 的 那 3 种 情况 外 , 还 可 能 存在 两 个 纯 战 略 纳什 均衡 无 混 含 战略 纳什 均 生 以 及 连续 的 纳 
件 均 本 的 情况 。 
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uP, UR = 是 有 限 的 , 且 对 每 个 i, S; 是 有 限 的 , 则 博弈 存在 至 少 一 
个 纳什 均衡 , 均衡 可 能 包含 混合 战略 - 


图 1.3.13 


纳什 定理 的 证 明 要 用 到 不 动 点 定理 。 作 为 不 动 点 定理 的 一 个 简单 例 
于 ,假定 乓 z) 是 一 个 定义 域 和 值 域 都 在 f0,1] 之 间 的 连续 函数 , 则 布 劳 尔 
(Brouwer) 的 不 动 点 定理 保证 了 存在 至 少 一 个 固定 的 点 一 一 即 在 [0, 1] 中 存 
在 至 少 一 个 值 zx" ,使 f(x')=x*。 图 1.3.13 给 出 了 一 个 例子 。 

运用 不 动 点 定理 证 明 纳 什 定理 包含 两 个 步骤 :(1) 证 明 一 个 特定 对 应 上 
的 任何 不 动 点 都 是 纳什 均衡 ;(2) 使 用 一 个 恰当 的 不 动 点 定理 证 明 这 一 对 应 
一 定 有 一 个 不 动 点 。 这 里 所 说 的 对 应 指 n 人 最 优 反 应 对 应 , 所 楷 的 “恰当 
的 不 动 点 定理 "应 归功 于 角 谷 (Kakutani，1941), 他 将 布 劳 尔 的 定理 从 函数 
推广 到 (符合 一 定 条 件 的 ) 对 应 。 

n 人 最 优 反 应 对 应 由 个 单个 参与 人 的 最 优 反应 对 应 通过 下 述 计 算得 
出 : 考 虐 尾 意 的 一 个 混合 战略 组 合 (p1,…, Pp ), 对 每 一 个 参与 者 i, 求 出 : 
针对 其 他 参与 者 混合 战略 (p14,…, pi -1 Divi > px) 的 最 优 反应 。 然 后 构 
建 每 一 参与 者 一 个 上 述 最 优 反 应 的 所 有 可 能 组 合 的 集合 (正式 地 说 , 即 导出 
每 一 参与 者 的 最 优 反应 对 应 , 然后 构建 这 = 个 参与 者 最 优 反 应 对 应 的 交叉 
积 ( 笛 卡 尔 积 ))。 一 个 混合 战略 组 合 (2 ,…, pr ) 是 这 一 对 应 集中 的 不 动 
R URC et p BRAM ple, pn ) 的 最 优 反应 的 所 有 可 能 
组 合 的 集合 。 即 ,对 每 个 i, p? 必须 是 参与 者 Cpl ple pie, 
pao ) 的 最 优 反应 (之 一 ), 这 又 恰好 符合 纳什 均衡 的 条 件 , 即 ( 轩 ,…, pr SE 
一 个 纳什 均衡 。 这 就 完成 了 第 (1) 步 。 

第 (2) 步 的 证 明 要 用 到 每 一 参与 者 的 最 优 反 应 对 应 都 在 某 种 条 件 下 连 
续 这 一 事实 。 在 布 劳 尔 的 不 动 点 定理 中 连续 性 的 作用 可 在 图 1.3.13 构建 
的 Az) 看 出 :如 果 f(z) 是 不 连续 的 ,不 动 点 就 不 一 定 存在 。 例 如 在 图 
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图 1.3.14 


1.3.14 中 ,对 所 有 r< ax, f(r) >2, AM rar, f(x) <2’ CHRRA 
1.3.14 中 的 f(x) 和 参与 者 的 最 优 反 应 对 应 的 不 同 之 处 , 考虑 图 1.3.10 中 
KRAM): H g= it, r" EET O 以 及 中 间 整 个 区 间 ( 稍 微 正式 
一 点 表述 , 即 r* (gq ) 包 括 了 当 g 从 左 侧 靠近 g 时 , r* (gq) 的 极限 ,以 及 g 
MEWE g It, 7 “(gq) 的 极限 ,并 且 包 插 这 两 个 极限 之 间 的 所 有 - 值 )。 
如 果 图 1.3.14 中 f(z') 要 成 为 类 似 的 参与 者 1 的 最 优 反应 对 应 r* (gg)， 
则 f(x') 的 值 不 仅 应 包含 实心 点 (如 图 所 示 ), 还 应 包含 空心 点 及 整个 虚线 
区 间 , 这 时 f(z) 就 会 在 x* 有 一 个 不 动 点 。 

每 个 参与 者 的 最 优 反 应 对 应 总 是 如 图 1.3.10 所 示 的 r* (gq ); 它 总 是 
包括 (借用 的 一 般 意 义 上 的 ) 从 左 侧 的 极限 、 从 右 侧 的 极限 以 及 其 间 的 所 有 
值 。 其 原因 在 前 面 讨论 两 个 参与 者 的 情况 时 已 经 证 明 ; 如 果 参 与 者 i Ae 
个 纯 战略 都 是 其 他 参与 者 混合 战略 的 最 优 反 应 , 则 参与 者 i 的 这 些 最 优 纯 
战略 的 任意 概率 的 线性 组 合 (并 令 其 他 纯 战 略 的 概率 为 0) 得 到 的 混合 战略 
P; 亦 是 参与 者 的 最 伏 反 应 。 由 于 每 一 参与 者 的 最 优 反应 对 应 总 是 具有 
这 一 特性 ,nx 人 最 优 反应 对 应 亦 具 有 这 一 特性 ;这 就 满足 了 角 谷 的 假定 , 于 
是 nn 人 最 优 反应 对 应 有 一 个 不 动 点 。 

纳什 定理 保证 了 相当 广泛 种 类 博弈 中 均衡 的 存在 性 ,但 第 1.2 节 应 用 
举例 所 分 析 的 博弈 却 不 在 此 列 (因为 每 一 参与 者 的 战略 空间 都 是 无 限 的 )。 
这 说 明 纳什 定理 中 的 假定 是 均衡 存在 性 的 充分 条 件 , 却 不 是 必要 条 件 一 一 
还 有 许多 博 奔 , 虽 不 满足 定理 假定 的 条 件 , 却 同 样 存在 一 个 或 多 个 纳什 均 
ie 


O fe ) 的 值 由 实 点 决定 ,空心 点 表示 A(x“) 不 包含 这 一 值 。 中 间 的 虚线 只 表示 r= 工时 、 
可 能 取 到 两 个 点 的 值 ,但 不 民 表 也 会 取 妈 中 间 任 何 一 点 的 前。 
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1.4 进一步 阅读 


关于 重复 列 除 严格 劣 战 略 和 纳什 均衡 的 假定 , 及 借用 参与 者 的 推断 来 
解释 泥 合 战略 .参见 布 兰 登 贝 格 尔 (1992)。 关 于 { 古 诺 型 ) 企 业 选 择 产量 模 
型 和 ( 贝 特 兰 德 型 ) 企 业 选 择 价格 模型 之 间 的 关系 , SLE A 
(Scheikman, 1983), 他 们 证 明 在 某 些 条 件 下 , 企业 面临 生产 能 力 的 约束 时 
(企业 在 选择 价格 之 前 ,要 付出 一 定 威 本 选择 生产 能 力 ), 贝 特 兰 德 型 模型 会 
出 现 古 诺 模型 的 结果 。 关 于 仲裁 , 参见 吉本 斯 (Gibbons, 1988), 他 说 明了 在 
最 后 要 价 仲裁 及 协议 伸 裁 中 , 钟 裁 者 所 偏好 的 方案 如 何 依赖 于 各 方 的 要 价 
中 所 包含 的 信息 。 最 后 ,关于 纳什 均衡 的 存在 性 , 包括 纯 战略 在 战略 空间 中 
TERR, 请 参考 达 斯 古 普 塔 和 马 斯 金 (Dasgupta & Maskin, 1986)。 


1.5 习题 与 练习 


第 1.1 节 

1.1 什么 是 博弈 的 标准 式 ? 在 博弈 的 标准 式 中 , 什么 是 严格 劣 战 略 ? 
什么 是 一 个 纯 战 赂 纳什 均衡 ? 

1.2 在 以 下 博弈 的 标准 式 中 , 哪些 战略 不 会 被 重复 蓟 除 严 格 劣 战略 所 
FAR? 纯 战 略 纳 什 均衡 又 是 什么 ? 


1.3 两 个 人 就 如 何 分 配 一 元 钱 进行 谈判 ,双方 同时 提出 各 自 希 望 得 到 
的 份额 ,分 别 为 sy 和 s2, 且 0 三 s,s 三 1。 A s t 251, MOAB BAH 
们 所 要 的 一 份 ; 如 果 s1+ 52> 1, MATAHARI. RY 
咯 纳什 均衡 。 


BIE CAAA EMR 39 


第 1.2 节 

1.4 假定 古 诺 的 寡头 董 断 模型 中 有 n 个 企业 , 令 q 代表 企业 i 的 产 
BA Q = 9i+ … ta 表示 市 场 总 产量 , p 表示 市 场 出 清 价格 , 并 假设 反 需 
RBM p(Q)=a- Q BHR. Q<a, HiME p =0)。 并 设 企业 i; 
生产 出 gi 的 总 成 本 Ci( gq;)= cq MRA RERE, 且 边 际 成 本 为 常数 c, 这 
里 我 们 设 c<<a。 RU HARE, 企业 同时 就 产量 进行 决策 。 求 出 博弈 的 
纳什 均衡 。 当 n 趋 于 无 穷 时 ,将 会 发 生 什么 情况 ? 

1.5 . 考虑 以 下 两 个 古 诺 双 头 曹 断 模型 的 战略 空间 有 限 的 情况 。 第 一 ， 
假定 每 个 企业 必须 选择 要 么 生产 董 断 产 出 的 一 半 gu/2= (ec - c)/4, 要么 
生产 古 诺 均 衡 产量 g. = (a ~ c)/3, 任何 其 他 产量 都 是 不 允许 的 。 证 明 这 一 
非 此 奴 彼 的 博弈 是 一 个 因 徒 困境 式 的 问题 :每 一 个 企业 都 有 一 个 严格 劣 战 
略 ,并 且 在 均衡 状态 下 , 每 一 企业 的 福利 都 要 比 他 们 相互 合作 时 下 降 。 第 
二 ,假设 每 个 企业 可 以 选择 g,,/2 或 g., 或 第 三 种 产量 9 , 求 出 一 个 g 的 
值 ,使 得 这 一 博弈 在 以 下 方面 等 价 于 第 1.2.A 节 中 的 古 诺 模型 , 即 (g., ge) 
是 惟一 的 纳什 均衡 ,并 且 在 均衡 状态 下 , 每 一 企业 的 福利 都 比 他 们 相互 合作 
时 要 低 ,但 两 个 企业 都 没有 严格 劣 战 略 。 

1.6 考虑 在 古 诺 双 头 垄断 模型 中 , 反 需 求 函 数 为 p(Q)=a - Q, 但 两 
企业 有 不 同 的 边际 成 本 , 企业 1 cy, 企业 2 为 cz* 求 出 当 每 个 企业 0< ci 
<a? 时 的 纳什 均衡 。 如 果 ci< cz<a 但 2cz>a+ci 纳 什 均衡 又 有 作 么 
变化 ? 

1.7 在 第 1.2.B 中 ,我 们 分 析 了 产品 有 差异 的 贝 特 兰 德 双 头 垄断 模 
型 。 同 质 产 品 的 情况 下 结论 是 十 分 明显 的 。 假 设 p< p 时 , 消费 者 对 企业 
i 产品 的 需求 为 a — pir pi> pi BAO, 六 = 而 时 为 (a 一 pi)/2。 同 时 假设 
不 存在 固定 成 本 , 且 边 际 成 本 为 常数 c, 这 里 ea, 证 明 如 果 企 业 同 时 选 
择 价格 , 则 惟一 的 纳什 均衡 就 是 每 个 企业 的 定价 均 为 c。 

1.8 ” 设 有 一 批 选民 在 一 个 单位 区 间 从 左 (x = 0) BAe =1) 均 名 分 
布 ,为 一 个 职位 参加 竞选 的 每 个 候选 人 同时 选择 其 竟 选 基地 [ 即 在 =0 到 
工 = 工 中 间 的 一 个 点 )。 选 民 观 察 候选 人 的 选择 , 然后 每 一 投票 人 把 票 投 给 
其 基地 高 自己 最 近 的 候选 人 。 上 比如 , 如 果 有 两 个 候选 入, 他 们 分 别 在 zi = 
0.3 和 zz=0.6 选 择 基地 ， 则 处 于 2 =0.45 左边 的 所 有 选民 都 会 把 票 投 给 
候选 人 1， 右边 的 人 都 会 把 票 投 给 候选 人 2, AFRE A 2 就 可 以 得 到 
55% 的 选票 启 得 这 场 选举 。 假 设 候选 入 员 关心 他 能 否 当 选 一 一 他 们 根本 上 
一 点 都 不 关心 其 基地 ! 如 果 有 两 个 候选 人 ， 博 弈 的 纯 战 略 纳 什 均 衡 是 什 
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A? 如 果 有 三 个 候选 人 ， 求 出 一 个 纳 伟 均衡 。 (假设 选 择 同一 个 基地 的 候 
选 人 将 平分 这 一 基地 可 得 的 选票 ， 得 票 最 高 的 候选 人 不 止 一 人 时 ， 谁 当选 
HOSE RIEU.) SMBH CHotelting, 1929) 关于 此 类 博 穿 的 早期 
模型 。 


第 1.3 节 

1.9 什么 是 标准 式 博弈 的 混合 战略 ? 什么 是 标准 式 博弈 的 混合 战略 
纳什 均衡 ? 

1.10 证 明 在 1.1 节 中 所 分 析 的 3 个 标准 式 博弈 一 一 囚徒 困境 、 图 
1.1.1 和 图 1.1.4 中 ,不 存在 混合 战略 纳什 均衡 。 

1.11 解 出 习题 1.2 所 给 博弈 的 混合 战略 纳什 均衡 。 

1.12 求 出 下 面 标准 式 博弈 的 混合 战略 纳什 均衡 。 


È R 


1.13 ”两 个 企业 各 有 一 个 工作 空缺 ,假设 企业 所 给 的 工资 不 同 (其 原因 
不 在 此 处 讨论 , 但 关系 到 每 一 个 空缺 的 价值 :企业 i 给 的 工资 为 zol, 这 里 
A/2)w < sa<2zole。 设想 有 两 个 工人 , 每 人 只 能 申请 一 份 工作 ,两 人 同时 
决定 是 申请 企业 1 的 工作 , 还 是 向 企业 2 申请 。 如 果 只 有 一 个 工人 向 一 个 
企业 申请 , 他 就 会 得 到 这 份 工 作 ; 如 果 两 个 工人 同时 向 一 个 企业 申请 工作 ， 
则 企业 随机 选择 一 个 工人 , 另 一 人 就 会 失业 {这 时 收益 为 0)。 解 出 两 工人 
标准 式 博弈 的 纳什 均衡 。( 要 更 进一步 了 解 企业 是 如 何 决 定 工资 的 , 请 参阅 
蒙哥马利 (Montgomery),1991) 

LAA 


向 企业 1 申请 向 企业 2 申请 


向 企业 1 申请 2w, 472w w wz 
向 企业 2 申请 wz, WI 1/2w,1/2w2 


TAL 


1.14 ”证明 附录 1.1.,C 中 的 命题 B 不 仅 对 纯 战略 成 立 , 对 混合 战略 同 
样 成 立 :在 混合 战略 纳什 均衡 中 , 概率 大 于 0 的 战略 一 定 不 会 被 重复 剔除 严 
ME AR ET IER o 
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完全 信息 动态 博弈 


本 章 介绍 动态 博弈 。 我 们 仍 集中 分 析 完 全 信息 的 博弈 { 即 参与 着 的 收 
益 函 数 是 共同 知识 的 博弈 );: 有 关 非 完全 信息 的 博弈 将 在 第 3 章 介绍 。 其 
中 第 2.1 节 分 析 完 全 且 完 美 信息 的 动态 博 灾 ， 这 是 指 在 博弈 进行 的 每 一 步 
当中 ， 要 选择 行动 的 参与 者 都 知道 这 一 步 之 前 博弈 进行 的 整个 过 程 。 从 
第 2.2 节 到 第 2.4 节 ， 我 们 讨论 完全 但 不 完美 信息 博弈 . 在 博弈 的 某 
些 阶段 ， 要 选择 行动 的 参与 人 并 不 知道 在 这 一 步 之 前 博弈 进行 的 整个 
过 程 。 

所 有 动态 博弈 的 中 心 问题 是 可 信任 性 。 作 为 不 可 署 入 的 威 欢 的 一 个 例 
子 , 考 虑 下 面 两 步 博弈 。 第 一 ,参与 者 1 选择 支付 1000 美元 钱 给 参与 者 2 
还 是 一 分 不 给 ;第 二 ,参与 者 2 观察 参与 者 1 的 选择 ,然后 决定 是 否 引 爆 一 
晒 手 雷 把 两 人 一 块 儿 炸 死 。 假 设 参 与 者 2 威胁 参与 者 1, 如 果 他 不 付 1000 
美元 就 引爆 手雷 , 如 果 参 与 者 1 相信 这 一 威胁 , 他 的 最 优 反应 是 支付 1000 
美元 ,但 参与 者 1 却 不 会 对 这 一 威胁 信 以 为 真 , 因为 它 不 可 置信 :如 果 给 参 
与 者 2 一 个 机 会 ,让 他 把 威胁 付 诸 实施 , 参与 者 2 也 不 会 选择 去 实施 它 , 这 
样 参与 者 1 就 会 一 分 不 付 。? 

第 2.1 节 分 析 如 下 类 型 完全 旦 完美 信息 的 动态 博弈 ;首先 参与 者 1 行 
动 ,参与 者 2 先 观 察 到 参与 者 1 的 行动 , 然后 参与 者 2 行动 ,博弈 结束 。 手 
雷 博弈 即 属 这 一 类 型 , 斯 塔 克 尔 由 里 (1934) 的 双 头 垄断 模型 ,里昂 惕 夫 
《Leontief, 1946) 的 有 工会 企业 中 的 工资 和 就 业 决定 模型 亦 属 这 一 类 博弈 。 
我 们 定义 此 类 博弈 的 逆向 归纳 解 (backwards-induction outcome) 并 简要 讨论 
它 与 纳什 均衡 的 关系 (这 一 关系 的 详细 讨论 在 第 2.4 节 )。 作 为 重子 ,我 们 
解 出 在 斯 塔 克 尔 贝 里 各 里昂 惕 夫 模 型 中 的 逆向 归纳 解 , 并 对 鲁 宾 斯 坦 (Ru- 


名 ”参与 者 工 可 能 会 考虑 威 驯 要 引爆 手 当 的 对 手 不 是 个 疯子 。 这 种 怀疑 在 模型 中 我 们 妻 示 为 
不 完全 信息 一 一 参与 者 1 对 参与 者 2 的 收益 函数 并 不 确定 。 和 参见 第 3 音 - 
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binstein, 1982) 的 讨价还价 模型 推导 出 相似 的 结果 , 尽管 后 面 的 博弈 有 潜在 
无 穿 多 步 的 行动 ,因此 并 不 属于 以 上 类 型 的 博 赛 。 

第 2.2 节 丰 富 了 前 一 节 分 析 的 博弈 类 型 :首先 参与 者 1 和 2 同时 行动 ， 
接着 参与 者 3 和 4 观察 到 1 和 2 选择 的 行动 , 然后 参与 者 3 和 4 同时 行动 , 
博弈 结束 。 这 里 的 同时 行动 意味 着 此 类 博弈 有 不 完美 信息 (这 一 点 在 第 
2.4 节 将 进一步 给 出 解释 )。 我 们 定义 这 种 博弈 的 子 博弈 精炼 解 (subgame- 
perfect outcome), 它 是 北向 归纳 方法 在 此 类 博弈 中 的 自然 延伸 。 在 应 用 举 
例 中 ,将 解 出 戴 蒙 德 和 过 布 维 格 (Diamond & Dybvig , 1983) 的 银行 挤 提 模 
DT NAN RC Lazear & Rosen, 1981) 的 锦标 赛 模型 的 结果 。 

第 2.3 节 研 究 重复 博弈 (repeated game)， 它 指 一 组 固定 的 参与 者 多 
次 重复 进行 同一 给 定 的 博弈 ， 并 且 在 下 次 博弈 开始 前 ， 参 与 者 都 可 以 观察 
到 前 面 所 有 博弈 的 结果 。 这 里 分 析 的 中 心 问题 是 〈 可 信 的 )》 威胁 和 对 以 后 
行为 所 租 的 承诺 可 以 影响 到 当前 的 行为 。 我 们 给 出 重复 博弈 中 子 博弈 精炼 
纳什 均衡 的 定义 ， 并 将 其 与 第 2.1 节 中 的 逆向 归纳 解 和 第 2.2 PE 
精炼 解 联系 起 来 ， 还 将 给 出 无 限 次 重复 博弈 中 的 无 名 氏 定理 (Folk Theo- 
rem) 及 其 证 明 。 在 应 用 举例 中 ， 将 分 析 弗 里 德 曼 (1971) HHERAB 
Si PRR, DP wea (Shapiro & Stiglitz, 1984) 
的 货币 政策 模型 。 

第 2.4 节 我 们 介绍 分 析 一 般 的 完全 信息 动态 博弈 所 需要 的 工具 ,不 再 
区 分 信息 是 否 是 完美 的 。 我 们 定义 博弈 的 扩展 式 表 述 并 将 其 与 第 一 章 介绍 
的 标准 式 表 述 相互 联系 起 来 ,同时 定义 一 般 博 弈 中 的 子 博 蛮 精 炼 纳什 均衡 。 
本 节 和 本 章 的 重点 都 在 于 , 一 个 完全 信息 动态 博弈 可 能 会 有 多 个 纳什 均衡 。 
但 其 中 一 些 均衡 也 许 包含 了 不 可 置信 的 威胁 或 承诺 , 子 博弈 精炼 纳什 均衡 
则 是 通过 了 可 信 性 检验 的 均衡 。 


2.1 完全 且 完 美 信息 动态 博 奔 


2.1.A 理论 : 道 向 归纳 法 


手雷 博弈 属于 下 面 简 单 类 型 的 完全 且 完 美 信息 动态 博弈 ; 

1. 参与 者 1 从 可 行 集 A1 中 选择 一 个 行动 a1， 

2. 参与 者 2 观察 到 a1, 之 后 从 可 行 集 A 中 选择 一 个 行动 az, 
3. 两 人 的 收益 分 别 为 u1(a1,a2) 和 w2{a1,a2)。 4 
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许多 经 济 问题 都 符合 这 种 博弈, O 其 中 的 两 个 例子 (后 面 将 进行 详细 
讨论 ) 是 斯 堵 克 尔 贝 蛙 的 双 头 垄断 模型 和 里 昂 惕 夫 的 有 工会 企业 工资 和 就 业 
模型 。 其 他 的 经 济 问题 可 通过 人 允许 更 长 的 行动 序列 建立 模型 :或 者 加 入 更 多 
的 参与 者 , 或 者 允许 参与 者 有 多 步行 动 ( 在 第 2.1.1 节 讨论 的 鲁 宾 斯 坦 的 讨 
价 还 价 模型 就 是 后 者 的 一 个 例子 )。 完 全 且 完 美 信息 动态 博弈 的 主要 特点 
是 :Ki 行动 是 顺序 发 生 的 , (i) 下 一 步行 动 选择 之 前 , 所 有 以 前 的 行动 都 可 
被 观察 到 , 及 (iii) 每 一 可 能 的 行动 组 台 下 参与 者 的 收益 都 是 共同 知识 。 

我 们 可 以 通过 道 向 归纳 法 求解 此 类 博弈 问题 ,方法 如 下 。 当 在 博弈 的 
第 二 阶段 参与 者 2 行动 时 , 由 于 其 前 参与 者 1 已 选择 行动 a 他 面临 的 决 
策 问题 可 用 下 式 表示 ; 


man wz(em az) - 
magia an az) 


Bet A, 中 的 每 一 个 a1, 参与 者 2 的 最 优化 问题 只 有 惟一 解 , 用 R 
(a1) 表 示 , 这 就 是 参与 者 2 对 参与 者 1 的 行动 的 反应 (或 最 优 反 应 )。 由 于 
参与 者 1 能 够 和 参与 者 2 一 样 解 出 2 的 问题 ,参与 者 1 可 以 预测 到 参与 者 2 
对 1 每 一 个 可 能 的 行动 a, 所 作出 的 反应 , 这样 1 在 第 一 阶段 要 解决 的 问题 
可 归结 为 : 


max uilas, Ra(a1)) ~ 


假定 参与 者 1 的 这 一 最 优化 问题 同样 有 惟一 解 , 表示 为 a? , 我 们 称 
(ay7 Ralat )) 是 这 一 博 守 的 道 向 归纳 解 。 逆 向 归纳 解 不 含有 不 可 置信 的 
威胁 :参与 者 1 预测 参与 者 2 将 对 1 可 能 选择 的 任何 行动 si 做 出 最 优 反 
应 ,选择 行动 Ra2《a1); 这 一 预测 排除 了 参与 者 2 不 可 置信 的 威胁 , 即 参与 者 
2 将 在 第 二 阶段 到 来 时 做 出 不 符合 自身 利益 的 反应 。 

在 第 一 章 中 我 们 用 标准 式 表 述 研 究 完全 信息 静态 博弈 , 并 作为 这 种 博 
弈 的 解 的 概念 ,重点 讨论 了 纳什 均衡 。 不 过 在 本 节 对 动态 博 讲 的 讨论 中 ,我 
们 既 不 涉及 标准 式 表述 , 亦 不 提 及 纳什 均衡 ;分 别 代 之 以 (1 一 (3) 中 对 博弈 
的 文字 描述 和 已 定义 的 逆向 归纳 解 。 在 第 2.4.A 节 中 , 为 了 使 概念 更 精 
确 ,我 们 将 定义 子 博 弈 精炼 纳什 均衡 为 ;只 有 不 包含 不 可 置信 的 威 助 的 纳什 
均衡 才 是 子 博 弈 精炼 纳什 均衡 .我 们 会 发 现 一 个 属于 (1) 一 (3) 所 界定 的 博 


由 ”参与 者 2 的 可 选择 行动 空间 Ar TURF KRISS A 1 的 行动 al。 这 种 依赖 性 可 以 表 
示 为 Az{a1), 或 者 可 以 合并 到 参与 者 ? 的 收益 函数 中 ,对 那些 给 定 a 时 不 可 行 的 az, 令 ular 
az) = - co。 有 时 参与 者 1 的 某 些 行动 甚至 可 以 结束 整个 博 窦 , 不 给 参与 者 2 行动 的 机 会 ,对 这 样 
的 a 值 ,可行 的 行动 空间 4x( ,) 中 只 有 一 个 元 素 , 令 参 与 者 2 别 无 选择 。 
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弈 可 能 会 有 多 个 纳什 均衡 , 但 惟一 的 子 博弈 精炼 纳什 均衡 就 是 与 道 向 归纳 
解 相 对 应 的 均衡 。 正 如 我 们 在 第 1.1.C 节 中 所 观察 到 的 ,有 些 博弈 会 有 多 
个 纳什 均 淆 ,但 有 一 个 均衡 明显 占 优 , 成 为 博弈 的 解 。 

本 节 的 最 后 , 我 们 探讨 逆向 归纳 法 背后 的 理性 假定 。 考 虑 下 面 的 三 步 
BE, 其 中 参与 者 1 有 两 次 行动 ， 

1. 参与 者 1 选择 L RR, RPL 使 博弈 结束 ,参与 者 1 的 收益 为 2, 参 
与 者 2 的 收益 为 0; 

2, 参与 者 2 观测 参与 者 1 的 选择 ,如 果 1 选择 R, U 2 选择 工 ' 或 R”， 
其 中 工 ' 使 博弈 结束 ,两 人 的 收益 均 为 1; 

3. 参与 者 1 观测 2 的 选择 (并 且 回 忆 在 第 一 阶段 时 自己 的 选择 )。 如 
果 前 两 阶段 的 选择 分 别 为 R 和 RR', 出 1 可 选择 LOR R”, 每 一 选择 都 将 结 
KEF, L“ 时 参与 者 1 的 收益 为 3，2 的 收益 为 0, 如 选 R”, 两 人 的 收益 分 别 
为 0 和 2。 

上 面 的 语言 描述 可 以 用 如 下 简明 的 博弈 树 表 示 ( 这 是 博弈 的 扩展 式 表 
述 , 我们 将 在 第 2.4 节 进 行 更 一 般 的 讨论 ) 。 博 弈 树 上 每 一 枝 的 末端 都 有 两 
个 收益 值 , 上面 代 表 参 与 者 1 的 收益 , 下 面 代表 参与 者 2 的 收益 。 


为 计算 出 这 一 博弈 的 逆向 归纳 解 ,我 们 从 第 三 阶段 ( 即 参 与 者 1 的 第 二 
次 行动 ) 开 始 。 这 里 参与 者 1 面临 的 选择 是 :1L” 可 得 收益 3，R” 可 得 收益 0， 
于 是 工 是 最 优 的 。 那 么 在 第 二 阶段 ,参与 者 2 预测 到 一 旦 博弈 进入 到 第 三 
阶段 , 则 参与 者 1 会 选择 ,这 会 使 2 的 收益 为 0, 从 而 参与 者 2 在 第 二 阶段 
的 选择 为 :L“ 可 得 收益 1, R” 可 得 收益 0, 于 是 工 是 最 优 的 。 这 样 , 在 第 一 
Bre, 参与 者 1 预测 到 如 果 博 弈 进入 到 第 二 阶段 ,2 将 选择 L“, 使 参与 者 1 
的 收益 为 1, 从 而 参与 者 1 在 第 一 阶段 的 选择 是 : 工 收益 为 2, RR 收益 为 1， 
于 是 LERH. 
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上 述 过 程 求 出 博弈 的 逆向 归纳 解 为 , 参与 者 1 在 第 一 阶段 选择 工 , 从 而 
使 博弈 结束 。 即 使 逆向 归纳 预测 博弈 将 在 第 一 阶段 结束 , 但 论证 过 程 的 重 
要 部 分 却 是 考虑 如 果 博 蛮 不 在 第 一 阶段 结束 时 可 能 发 生 的 情况 。 比 如 在 第 
二 阶段 , 当 参 与 者 2 巴 测 如 果 博 弈 进入 第 三 阶段 , 则 ! 会 选择 1“, 这 时 2 假 
定 1 是 理性 的 。 由 于 只 有 在 1 偏离 了 博弈 的 逆向 归纳 解 , 才能 轮 得 到 2 选 
择 行动 ,而 这 时 2 对 1 的 理性 假定 便 看 似 是 韦 盾 的, 即 如 果 1 在 第 一 阶段 选 
择 了 R ,那么 第 二 阶段 2 就 不 能 再 假定 1 是 理性 的 了 。 但 这 种 理解 是 不 对 
的 :如 果 1 在 第 一 阶段 选择 了 尽 , 则 两 个 参与 者 都 是 理性 的 就 不 可 能 是 共同 
知识 ,但 这 时 1 仍 有 理由 在 第 一 阶段 选择 只 , 却 不 与 2 对 1 的 理性 假定 相 矛 
盾 。 一 种 可 能 是 “参与 者 1 是 理性 的 "是 共同 知识 ,但 “参与 者 2 是 理性 
的 " 却 不 是 共同 知识 :如 果 1 认为 2 可 能 不 是 理性 的 , 则 1 就 可 能 在 第 一 阶 
BUA R, A 2 在 第 二 阶段 选择 R ,从 而 给 1 以 机 会 在 第 三 阶段 选择 
L”。 另 一 种 可 能 是 “参与 者 2 是 理性 的 "是 共同 知识 ,但 “参与 者 1 是 理性 
的 " 却 不 是 共同 知识 :如 果 1 是 理性 的 ,但 推测 2 可 能 认为 1 是 非 理性 的 ,这 
时 1 也 可 能 在 第 一 阶段 选择 RA 2 会 认为 1 是 非 理性 的 而 在 第 二 阶段 
选择 RW 1 能 在 第 三 阶段 选择 R”"。 递 向 归纳 中 关于 1 在 第 一 阶段 选 
择 R 的 假定 可 通过 上 面 的 情况 得 到 解释 。 不 过 在 有 些 博弈 中 ,对 1 选择 了 
R 的 更 为 合理 的 假定 是 1 确实 是 非 理 性 的 。 在 这 样 的 博弈 中 , 逆向 归纳 在 
预测 博弈 进行 方面 就 会 失去 其 大 部 分 作用 , 正 像 在 博弈 论 不 能 提供 惟一 解 
并 不 能 达成 协议 的 博弈 中 , 纳什 均衡 也 对 预测 博弈 的 结果 所 助 无 几 。 


2.1.B 斯 培 克 尔 贝 里 双 头 垄断 模型 


斯 塔 克 尔 贝 里 (1934) 提 出 一 个 双 头 垄断 的 动态 模型 , 其 中 一 个 支配 企 
业 ( 领 导 者 ) 首 先行 动 , 然后 从 属 企业 (追随 者 ) 行 动 。 比 如 在 美国 汽车 产业 
发 展 史 中 的 某 些 阶段 ,通用 汽车 就 扮演 过 这 种 领导 者 的 角色 (这 一 例子 把 模 
型 直接 扩展 到 允许 不 止 一 个 追随 企业 , 如 福特 、 克 莱 斯 勒 等 等 )。 根 据 斯 塔 
克 尔 贝 里 的 假定 ,模型 中 的 企业 选择 其 产量 , 这 一 点 和 古 诺 模型 是 一 致 的 
(只 不 过 古 诺 模 型 中 企业 是 同时 行动 的 , 不 同 于 这 里 的 序 贯 行动 )。 至 于 在 
类 似 于 贝 特 兰 德 模型 中 企业 (同时 地 ) 选 择 价 格 的 假定 下 , 如 何 构建 相似 的 
FRTDRA, 我们 留 作 习 感 请 读者 自己 练习 。 


O ”回想 我 们 在 重复 删除 严格 劣 战略 的 评论 时 { 在 第 1.1.B 节 ). 参 与 者 是 理性 的 是 共同 知识 . 
如 果 所 有 参与 者 都 是 理性 的 , 并 且 所 有 参与 者 都 知道 所 有 参与 者 都 是 王 性 的 , 并 且 所 有 参与 者 都 知 
道 所 有 参与 者 都 知道 所 有 参与 者 都 是 理性 的 ,如 此 等 等 , 以 至 无 穷 。 
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WA HF F : (DEA 1 选择 产量 90; (2) ak 2 MD q, 
然后 选择 产量 9 之 0;(3) 企 业 i A i PA R E 
mg g= gqg{(Q)- el. 
这 里 pt(Q) =a-Q, 是 市 场 上 的 总 产品 Q = a+ gz 时 的 市 场 出 清 价格 , < 
是 生产 的 边际 成 本 , 为 一 常数 (固定 成 本 为 0)。 
为 解 出 这 一 博弈 的 道 向 归纳 解 , 我 们 首先 计算 企业 2 对 企业 1 任意 产 
量 的 最 优 反 应 , RR,( gq 1) 应 满足 


max mlg 92) = may @la-—aq-—agqz.-<] , 
由 上 式 可 得 
Ra(q1) = EE 


2 > 
BM ga- c, EH 1.2.8 节 我 们 分 析 同时 行动 的 古 诺 博弈 中 ,得 出 的 R 
(gq1) 和 上 式 完全 一 致 ,两 者 的 不 同 之 处 在 于 这 里 的 R VEEE 2 对 企业 
1 已 观测 到 的 产量 的 真实 反应 ,而 在 古 诺 的 分 析 中 , R q1) 是 企业 2 对 假定 
的 企业 1 的 产量 的 最 优 反 应 , HER 1 的 产量 选择 是 和 企业 2 同时 作出 的 。 

由 于 企业 1 也 能 够 像 企业 2 一样 解 出 企业 2 的 最 优 反应 , 企业 1 就 可 
以 预 注 到 他 如 选择 q 企业 2 将 根据 Rg NPR. BBA, 在 博弈 的 
第 一 阶段 ,企业 + 的 问题 就 可 表示 为 


maz mq, Ralq)) = mae qıla — qı- R2(q1) - c] 


SOPIEN 
TRSN 2 
由 上 式 可 得 
. anc 
a3 
及 Rai) = Te ， 


TE LATS FEAR M EIRA E E AE a he 

回顾 在 第 1 Eh RER Ah, 每 一 企业 的 产量 为 (a ~ 0/3, 
也 就 是 说 , 斯 塔 克 尔 摧 里 博弈 中 逆向 归纳 解 的 总 产量 3(a -~ <)/4, 比 古 诺 博 
弈 中 纳什 均衡 的 总 产量 2(a - <)/3 要 高 , 从 而 斯 塔 克 尔 贝 里 博弈 相应 的 市 


人 中 ”正如 * 古 诺 坞 衡 " 和 * 贝 特 兰 攻 均 策 " 一 般 是 指 吉 诺 和 贝 特 兰 德 博弈 中 的 纳 科 均衡 , 担 玉 "斯 
塔 克 尔 贝 里 均衡 "一 般 表 示 序 鞭 行 动 博弈 , 用 以 和 同时 行动 相 区 别 。 但 如 前 一 节气 到 过 的 , 序 蓝 行 
动 博 讲 有 时 会 有 多 个 纳什 均衡 , 只 有 一 个 是 和 搏弈 的 逆向 归纳 解 相关 的 ,这 样 “斯 塔 克 和 尔 贝 里 均衡 ” 
RAT RES X, KERER RT IEA, 又 用 来 表示 比 简 单 纳什 均衡 条 件 更 强 的 解 的 概念 。 
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场 出 清 价格 就 比较 低 。 不 过 在 斯 塔 克 尔 贝 里 博弈 中 , 企业 1 完全 可 以 选择 
古 诺 均衡 产量 (a - c)/3, 这 时 企业 2 的 最 优 反应 同样 是 十 诺 均衡 的 产量 ， 
也 就 是 说 在 斯 塔 克 尔 贝 里 博弈 中 , 企业 1 完全 可 以 使 利润 水 平 达到 古 诺 均 
衡 的 水 平 , 而 却 选择 了 其 他 产量 , 那么 企业 1 在 斯 塔 克 尔 贝 里 博弈 中 的 利润 
一 定 高 于 其 在 古 诺 博弈 中 的 利润 。 但 斯 塔 克 尔 贝 里 博弈 中 的 市 场 出 清 价 格 
降低 了 ,从 而 总 利润 水 平 也 会 下 降 , 那么 和 古 诺 博 赛 的 结果 相 比 , 在 斯 塔 克 
尔 贝 里 博弈 中 , 企业 1 利润 的 增加 必定 意味 着 企业 2 福利 的 恶化 。 

和 古 诺 博弈 相 比 ,斯 塔 克 尔 贝 里 博弈 中 企业 2 利润 水 平 的 降 狼 ,揭示 了 
单 人 决策 问题 和 多 人 决策 问题 的 一 个 重要 不 同 之 处 。 在 单 人 决策 理论 中 ， 
占有 更 多 的 信息 决 不 会 对 决策 制定 者 带 来 不 利 , 然而 在 博弈 论 中 , TRES 
的 信息 (或 更 为 精确 地 说 , 是 让 其 他 参加 者 知道 一 个 人 掌握 更 多 的 信息 ) 却 
可 以 让 一 个 参与 者 受 损 。 

在 斯 塔 克 尔 贝 里 博弈 中 , 存在 问题 的 信息 是 企业 的 产量 :企业 2 知道 qi， 
并 且 ( 重 要 的 是 ) 企 业 1 知道 企业 2 知道 gl。 为 看 清楚 这 一 信息 的 影响 , 我 们 
把 上 面 序 贯 行动 的 博弈 稍 作 修改 , 假设 企业 1 先 选择 qi, 之 后 企业 2 选择 q, 
但 事前 并 没有 观测 到 gl。 如 果 企业 2 确信 企业 工 选择 了 它 的 斯 塔 克 尔 贝 里 
产量 gf =(e 一 c)/2 则 企业 2 的 最 优 反应 仍 是 R? (gq? ) = (a 一 c)/4。 但 是 ， 
如 果 企业 1 预测 到 企业 2 将 持 有 这 一 推断 并 选择 这 一 产量 , 企业 1 就 会 倾向 
于 它 对 (a - c)/4 的 最 优 反应 一 一 即 3(a -c)/8 一 一 而 不 愿 去 选择 斯 塔 克 尔 
贝 里 产量 (a - c)/2, 那么 企业 2 就 不 会 相信 企业 1 选择 了 斯 塔 克 尔 贝 里 产 
量 。 从 而 这 一 禾 改 过 的 序 贯 行动 博弈 的 惟一 纳什 均衡 , 对 两 个 企业 都 是 选择 
产量 (a - “)/3 一 -这 正 是 古 诺 博 弈 中 的 纳什 均衡 ,其 中 企业 是 同时 行动 的 - 
亦 即 , 使 企业 1 知道 ,企业 2 知道 91 给 企业 2 带 来 了 损失 。 


2.1.C 有 工会 企业 的 工资 和 就 业 


在 里 昂 惕 夫 (1946) 模 型 中 ,讨论 了 一 个 企业 和 一 个 垄断 的 工会 组 织 ( 即 
作为 企业 劳动 力 惟一 供给 者 的 工会 组 织 ) 的 相互 关系 :工会 对 工资 水 平 说 一 
不 二 , 但 企业 却 可 以 自主 决定 就 业 人 数 ( 在 更 符合 现实 情况 的 模型 中 , 企业 
和 工会 间 就 工资 水 平 讨 价 还 价 , 但 企业 仍 自主 决定 就 业 , 得 到 的 定性 结果 与 
本 模型 相似 )。 工 会 的 效用 函数 为 Uw, lL) 其 中 w 为 工会 向 企业 开 出 欧 


全 ”此 例 也 说 明了 ,我 们 在 第 1.1.A 节 中 作出 的 一 个 结论 :在 标准 式 博 许 中 , 参与 者 同时 逃 择 
各 自 的 战略 , 但 这 并 不 要 求 各 方 必 须 同 时 行动 ;只 要 每 个 人 在 选择 自己 的 行动 时 不 知道 其 他 人 的 选 
择 就 足够 了 。 关 于 这 一 点 的 进一步 讨论 参见 第 2.4.A 节 。 
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TKF, L 为 就 业 人 数 。 假 定 U(zm, 上 L) 是 w 和 上 的 增 函 数 。 企 业 的 利 
润 函数 为 x(mw, 工 )= 只 (L)- wh, ÈP ROL AR L 名 工人 可 以 取 
得 的 收入 (在 最 优 的 生产 和 产品 市 场 决 策 下 ), 假定 RCL, 并 且 为 
MAZ (concave) « 

假定 博弈 的 时 序 为 :(1) 工 会 给 出 需要 的 工资 水 平 w;(2) 企 业 观 测 到 
GHEE) w, 随后 选择 雇佣 人 数 工 ;(3) 收 益 分 别 为 UC(w, LL) 和 (zw, 工 )。 
即使 没有 假定 U(w, LOA R(L) 的 具体 的 表达 式 , 从 而 无 法 明确 解 出 该 博 
弈 的 道 向 归纳 解 ,但 我 们 仍 可 以 就 解 的 主要 特征 进行 讨论 。 

首先 , 对 工会 在 第 一 阶段 任意 一 个 工资 水 平 w, 我 们 能 够 分 析 在 第 二 
HAD W RRR (wm) 的 特征 。 给 定 w, 企业 选择 L"《w) 满 足下 式 : 


maxx(w,L) = maxR(L) - wL , 
一 阶 条 件 为 
RCL)J-w=0. 
为 保证 一 阶 条 件 RL) - w=0 有 和 解 ,假定 R'(0)= 0, H R (oo) =0, 4 
图 2.1.1 所 示 。 


Le sw 


R) 


L* (w) 


图 2.1.1 


201.298 L Cw) BARB w 的 函数 (但 是 标 轴 经 过 旋转 , 以 便于 和 以 
后 的 数据 相 比 较 ), 并 表示 出 它 各 企业 每 条 等 利润 线 交 于 其 最 高 点 。? BS 


D 后 面 一 点 只 不 过 是 了 “Cw) 定 义 的 另 一 种 表述 , 即 对 给 定 的 w, L Cw Ew, LORA 
化 。 化 如 工会 开价 ww', 则 企业 滑 w= w 的 水 平 线 选 择 上 ,而 企业 选择 的 就 业 工 能 使 可 能 的 利润 达 
到 最 高 ,从 而 使 通过 (LL, w“) 的 等 利润 曲线 与 约束 w = w HT. 
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L 保持 不 变 , w 降低 时 企业 的 利润 就 会 提高 , 于 是 较 低 的 等 利润 曲线 代表 
了 较 高 的 利润 水 平 。 图 2.1.3 描述 了 工会 的 无 差异 曲线 , 若 令 LPE, 当 
w 提高 时 工会 的 福利 就 会 增加 , 于 是 较 高 的 无 差异 曲线 代表 丁 工会 较 高 的 
效用 水 平 。 


L*(@"*) 


企业 的 等 利润 曲线 


图 2.1.2 


工会 的 无 差异 曲线 
2.1.3 


下 面 我 们 分 析 工 会 在 第 一 阶段 的 问题 , 由 于 工会 和 企业 同样 可 以 解 出 
企业 在 第 二 阶段 的 问题 , 工会 就 可 预测 到 如 果 它 要 求 的 工资 水 平 为 w È 
业 最 优 反 应 的 就 业 人 数 将 会 是 工 ”〈《zl)。 那 么 ,工会 在 第 一 阶段 的 问题 可 
以 表示 为 : 


maxU (w, L” (w)) . 
表现 在 图 2.1.3 的 无 差异 曲线 上 就 是 , 工会 希望 选择 一 个 工资 水 平 


52 FEE 


w, 由 此 得 到 的 结果 (由 , 工 ”(w)) 处 于 可 能 达到 的 最 高 的 无 差异 线 上 。 这 
一 最 优化 问题 的 解 为 w’, 这样 一 个 工资 要 求 将 使 得 工会 通过 (zw ”, 工 “ 
(w")) 的 无 差异 曲线 与 L"(w) 相 切 于 该 点 ,如 图 2.1.4 所 示 。 从 而 ， 
OW, L Cw” D 就 是 这 一 工资 与 就 业 博弈 的 逆向 归纳 解 。 


工会 的 无 差异 曲线 


L*(w*) L 
图 2.1.4 


更 进一步 我 们 还 可 以 看 出 , (w, LC ')) 是 低 效 率 的 ,在 图 2.1.5 
中 ,如 果 w 和 工 处 于 图 中 阴影 部 分 以 内 , 企业 和 工会 的 效用 水 平 都 会 提高 。 
这 种 低 效率 对 实践 中 企业 对 筷 傅 工人 数量 保持 的 绝对 控制 权 提 出 了 质疑 。 
(允许 工人 和 企业 就 工资 相互 讨价还价 ,但 企业 仍 对 雇 作 工人 数量 绝对 控 
制 , 也 会 得 到 相似 的 低 效 率 解 )。 埃 斯 皮 诺 萨 和 里 (Espinosa & Rhee, 1989) 
基于 如 下 事实 为 这 一 质疑 提供 了 一 个 解释 :企业 和 工会 之 间 经 常会 进行 定 
期 或 不 定期 的 重复 谈判 (在 美国 经 常 是 每 三 年 一 次 ), 在 这 样 的 重复 博弈 中 ， 
可 能 会 存在 一 个 均衡 ,使 得 工会 的 选择 w 和 企业 的 选择 L 都 在 图 2.1.5 所 
示 的 阴影 部 分 以 内 ,即使 在 每 一 次 性 谈判 中 , 这 样 的 w 和 上 都 不 是 逆向 归 
纳 解 。 参 见 第 2.3 节 中 关于 重复 博弈 的 讨论 ,以 及 习题 2.16 对 埃 斯 皮 诺 萨 
和 里 模型 的 分 析 。 


2.1.D FFRRA 


我 们 首先 分 析 一 个 三 阶 谈判 模型 , 它 属于 第 2.1.A 节 分 析 过 的 博弈 模 
型 ,然后 我 们 讨论 鲁 宾 斯 坦 (1982) 模 型 ,其 中 博弈 的 (潜在 ) 阶 段 数 是 无 限 
的 。 在 所 有 两 个 模型 中 ,都 可 马上 得 到 谈判 结果 一 一 不 可 能 发 生 持 久 的 谈 
判 ( 如 罢工 )。 与 此 相反 ,在 索 贝 尔 和 高 桥 (Sobel & Takahashi 1983) 关 于 非 
WHS TAP ARR, 黑 工 的 发 生 以 正 概率 存在 于 惟一 的 (精炼 由 
叶 斯 ) 均 衡 之 中 ,参见 第 4.3.B 节 。 
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| 企业 的 等 利润 曲线 


La* {rw*) 


图 2.1.5 


参与 人 1 和 2 就 一 美元 的 分 配 进行 谈判 。 他 们 轮流 提出 方案 :首先 参 
与 人 1 提出 一 个 分 配 建 议 ,参与 人 2 可 以 接受 或 拒绝 ;如 果 参 与 人 2 拒绝 ， 
就 由 参与 人 2 提出 分 配 建议 , 参与 人 1 选择 接受 或 拒绝 ;如 此 一 直 进 行 下 
去 。 一 个 条 件 一 旦 被 拒绝 , 它 就 不 再 有 任何 约束 力 ,并 和 博弈 下 面 的 进行 不 
再 相关 。 每 一 个 条 件 都 代表 一 个 阶段 ,参与 人 都 没有 足够 的 耐心 :他 们 对 后 
面 阶段 得 到 的 收益 进行 贴现 , 每 一 阶段 的 贴现 因子 为 8, 这 里 0< 8<1。3 

下 面 是 对 三 阶段 谈判 博弈 时 序 的 更 为 详细 的 描述 : 

(12) 在 第 一 阶段 开始 时 , 参与 人 1 建议 他 分 走 1 美元 的 s1, 留 给 参与 人 
2 的 份额 为 1 si; 

(1b) 参 与 人 2 或 者 接受 这 一 条 件 ( 这 种 情况 下 ,博弈 结束 , 参与 人 1 的 
收益 为 ;1, 参与 人 2 的 收益 为 1 - 5), 都 可 立刻 拿 到 ), 或 者 拒绝 这 一 条 件 
《这 种 情况 下 , 博弈 将 继续 进行 ,进入 第 二 阶段 ); 

{2a) 在 第 二 阶段 的 开始 , 参与 人 2 提议 参与 人 1 分 得 1 美元 的 sz, 留 给 
参与 人 2 的 份额 为 1- 51( 请 注意 在 阶段 ,s, 总 是 表示 分 给 参与 人 1 的 ,而 
不 论 是 谁 先 提 出 的 条 件 ); 

(2b) 参 与 人 1 或 者 接受 条 件 ( 这 种 情况 下 , 博弈 结 来, 参与 人 1 的 收益 
sz 和 参与 人 2 的 收益 1 - ss 都 可 立即 拿 到 ), 或 者 拒绝 这 一 条 件 (这 种 情况 
下 ,博弈 继续 进行 , 进入 第 三 阶段 》; 

(3) 在 第 三 阶段 的 开始 ,参与 人 1 得 到 1 美元 的 s, 参与 人 2 得 到 1-;， 


中 ”贴现 因子 3 反 晓 了 货币 的 时 间 价 值 。 在 一 个 阶段 开始 时 取得 的 一 美元 可 以 存 和 银行, 赚 
RAB, 比如 说 每 期 利息 为 ~, 则 在 下 一 阶段 开始 时 的 价值 就 成 为 1+ > 美元 。 辐 样 , 下 一 阶段 开始 
时 要 得 到 的 一 美元 .现在 的 价值 只 有 17{1+ >) 美 元 。 令 B= 1/14 7r), 风 下 一 阶段 可 得 到 的 收益 
MERA fir, 距 现 在 两 个 防 八 之 后 得 到 的 收益 * 现 值 只 有 #?x, 如 此 等 等 。 未 来 收益 今天 的 愉 值 称 
为 这 一 收益 的 现 值 。 


54 PSP IC A Re 


这 里 0<s<1。 

在 这 样 的 三 阶段 博弈 中 , 第 三 阶段 的 解决 方案 (*,1- ;) 是 外 生 给 定 的 。 
在 我 们 后 面 将 考虑 的 无 限期 模型 中 , 第 三 阶段 的 收益 s 将 表示 如 果 博 弈 进 
行 到 第 三 阶段 ( 即 如 果 前 面 两 个 提议 都 被 拒绝 ) 的 话 , 参与 人 1 在 其 后 进行 
的 博 穿 中 可 得 到 的 收益 。 

为 解 出 此 三 阶段 博弈 的 逆向 归纳 解 , 首先 需要 计算 如 果 博 弈 进行 到 第 
二 阶段 ,参与 人 2 可 能 提出 的 最 优 条 件 。 参 与 人 1 拒绝 参与 人 2 在 这 一 阶 
MOA ss, 可 以 在 第 三 阶段 得 到 *, 但 下 一 阶段 的 * 在 当期 的 价值 只 有 
6s。 那 么 , 当 且 仅 当 y20-s, FSA 1 才 会 接受 *?( 我 们 假定 当 接受 和 拒绝 
并 无 差异 时 ,参与 人 总 是 选择 接受 条 件 )。 从 而 参与 人 2 在 第 二 阶段 的 决策 
问题 就 可 归于 在 本 阶段 收入 1- 8"s( 通 过 向 参与 人 1 提出 条 件 ,给 他 sz= 
3.5) 和 下 阶段 收入 工 - :( 通 过 向 参与 人 1 提出 条 件 ,给 他 任意 的 :< d+) 
之 间作 出 选择 。 后 一 选择 的 贴现 值 为 6.(1 一 s), 小 于 前 一 选择 可 得 的 1- 
-5, 于 是 参与 人 2 在 第 二 阶段 可 以 担 出 的 最 优 条 件 是 ;2 = 3.*。 也 就 是 
说 ,如 果 博 弈 进行 到 第 二 阶段 ,参与 人 2 将 提出 条 件 s? ,参与 人 1 选择 接受 
条 件 。 

由 于 参与 人 1 可 以 和 参与 人 2 同样 地 解 出 参与 人 2 在 第 二 阶段 的 决策 
问题 ,参与 人 1 也 就 知道 参与 人 2 通过 拒绝 参与 人 1 的 条 件 ,在 第 二 阶段 可 
以 得 到 1 sz2 ,但 下 一 阶段 得 到 的 1- ;2? 在 本 阶段 的 价值 只 有 8-0- 
sto MA, SAMS 1- sys (1 - sz) MR si -8-(L- sf) WH, BSA 
2 才 会 接受 1 - st。 从 而 参与 人 ! 在 第 一 阶段 的 决策 问题 就 可 归于 在 本 阶 
BMWA 1-6-1 sf 六 通过 向 参与 人 2 提出 条 件 1-s=8' (1- 江 ))》 和 下 
阶段 收入 sf (通过 向 参与 人 2 提出 出 任意 的 1- s,<8.(1- s2 )) 之 间作 出 
选择 。 后 一 选择 的 贴现 值 为 38. sf = 632…, 小 于 前 一 选择 可 得 的 1 一 8:(1 一 
sp) =1-80- 8's), TESIA 1 在 第 一 阶段 提出 的 最 优 杀 件 是 sy =1 
-8-(1-sf)=1-6(1- 3:s)。 这 样 ,在 此 三 阶段 博弈 的 逆向 归纳 解 中 ， 
参与 人 1 向 参与 人 2 提出 分 配方 案 (s? ,1 一 s 广 ), 后 者 接受 该 方案 。 

现在 考虑 无 限期 的 情况 。 博 弈 时 序 和 前 面 的 摘 述 完全 一 致 ,只 是 第 (3) 
阶段 给 出 的 外 生 和 解决 方案 被 其 后 的 无 限 步 讨价还价 (3a)、(3b)、(4a) (4b) 
等 等 所 代替 :奇数 步 由 参与 人 1 出 条 件 , 偶数 步 由 参与 人 2 出 条 件 , 直至 一 
方 接受 条 件 , 讨价还价 结束 。 和 前 面 分 析 过 的 所 有 应 用 一 样 , 我 们 希望 能 够 
从 后 向 前 推出 这 一 无 限 步 博 弃 的 道 向 归纳 解 。 但 是 , 由 于 博弈 可 能 会 无 限 
地 进行 下 去 , 因此 并 不 存在 我 们 借以 入 手 分 析 的 最 后 一 步行 动 。 幸 而 下 面 
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的 发 现 (首先 由 谢 克 德 和 萨 顿 (Shaked& Sutton, 1984) 所 运用 ), 使 我 们 可 以 
把 无 限 祷 弈 截 开 , 并 应 用 对 有 限 博 蛮 分 析 的 蚂 辑 进行 分 析 : 从 第 三 阶段 并 始 
的 博弈 (如 果 能 进行 到 这 一 阶段 ) 与 (从 第 一 阶段 开始 的 ) 整 个 过 程 的 博弈 是 
相同 的 一 一 两 种 情况 下 ,都 是 由 参与 人 1 首先 提出 条 件 ,其 后 两 个 参与 人 轮 
流出 价 ,直至 有 一 方 接受 条 件 谈判 结束 。 

由 于 尚未 正式 定义 此 类 无 限 博弈 的 逆向 归纳 解 ,我 们 的 讨论 也 将 是 非 
正式 的 (但 也 可 以 进行 正式 讨论 )。 假 设 完整 过 程 的 博弈 存在 逆向 归纳 解 ， 
此 时 参与 人 1 和 2 分 别 得 到 s 和 1- :。 我 们 可 以 把 这 个 结果 用 于 从 第 三 
阶段 开始 的 博 穿 ,如 果 博 弈 进行 到 第 三 阶段 的 话 , 然后 道 向 推 至 第 一 阶段 
{过 程 与 三 阶段 博弈 中 相同 ), 可 计算 出 整个 博弈 的 新 的 逆向 归纳 解 。 在 这 
一 新 的 逆 识 归纳 解 中 , 参与 人 1 将 在 第 一 阶段 提出 解决 方案 (J(s),1 -和 
(s)), 参与 人 2 会 接受 这 一 方案 。 这 里 的 f(s)}=1- 8S(1- 65), 就 是 上 面 
讨论 过 的 ,在 第 三 阶段 解决 方案 (s, 1 s) 外 生 给 定 条 件 下 , 参与 人 1 第 一 阶 
段 得 到 的 份额 。 

令 sy 为 参与 人 1 在 全 过 程 博弈 中 可 能 得 到 的 逆向 归纳 解 下 的 最 高 收 
益 。 设 想 sp 为 参与 人 1 第 三 阶段 的 收益 , 则 如 前 所 述 , 这 将 产生 一 个 新 的 
道 向 归纳 解 .其 中 参与 人 1 第 一 阶段 的 收益 为 F(sa)。 由 于 F(s)=1 一 人 + 
Os 是 s 的 增 函 数 . sn 是 第 三 阶段 可 能 达到 的 最 高 收益 , f(sn) 也 就 是 第 一 
阶段 可 能 达到 的 最 高 收益 。 但 同时 sy 又 是 第 一 阶段 可 能 达到 的 最 高 收益 
于 是 有 f(sy) = sao 相似 的 论证 可 证 明 f(s.) = sz, 这 里 的 s 为 参与 人 1 
在 全 过 程 博 弈 中 可 能 得 到 的 着 向 归纳 解 下 的 最 低 收 益 。 满 足 /(s)=s 的 
惟一 的 * 值 为 1/(1+ 8), BA s HR. BA sy = 并 = ,于 是 整个 过 程 
博 计 有 惟一 的 逆向 归纳 解 :在 第 一 阶段 ,参与 人 1 向 参与 人 2 提出 分 配方 案 
(s =1/(1+ 8),1-s* =6/(1* 人 8)), 后 者 接受 该 方案 。 


2.2 完全 非 完美 信息 两 阶段 博 弃 


2.2.A 理论 : 子 博弈 精炼 


现在 我 们 对 前 一 节 所 讨论 的 博弈 类 型 加 以 丰富 。 和 在 完全 且 完 美 信息 
动态 博弈 中 相同 , 我们 继续 假定 博弈 的 进行 分 为 一 系列 的 阶 眉 ,下 一 阶段 开 
始 前 参与 者 可 观察 到 前 面 所 有 阶段 的 行动 。 与 上 节 分 析 的 不 同 之 处 在 于 ， 
本 节 我 们 每 一 阶段 中 存在 着 同时 行动 。 在 第 2.4 节 更 进一步 的 分 析 中 我 们 


S6_ (ERLER 


将 看 到 , 这 种 阶段 内 的 同时 行动 意味 着 本 节 分 析 的 博弈 包含 了 不 完美 信息 。 
然而 ,此 类 博 弃 和 前 一 节 所 讨论 的 博弈 嗓 有 着 很 多 共同 特性 。 

我 们 将 分 析 以 下 类 型 的 简单 博弈 , 并 (多 人 么 缺乏 创意 地 ) 称 其 为 完全 非 
完美 信息 两 阶段 博弈 : 

1. 参与 者 1 和 2 同时 从 各 自 的 可 行 集 A 和 A, 中 选择 行动 a 和 a2, 

2. 参与 者 3 和 4 观察 到 第 一 阶段 的 结果 , (ai, a2), 然后 同时 从 各 自 的 

可 行 集 As 和 44 中 选择 行动 a 和 a4， 

3. 收益 为 ula azas as), i=1,2,3, 4e 

许多 经 济 学 问题 都 符合 以 上 的 特点 ,中 其 中 三 个 例子 (后 面 进行 详细 
讨论 ) 包 括 对 银行 的 挤 提 、 关 税 和 国际 市 场 的 不 完全 竞争 以 及 工作 竞赛 (如 

-个 企业 中 , 几 个 副 总 裁 为 下 一 任 总 裁 而 竞争 )。 还 有 很 多 经 济 问题 可 通过 
把 以 上 条 件 稍 如 改动 而 建立 模型 , 比如 增加 参与 者 人 数 或 者 允许 同一 参与 
者 (在 一 个 以 上 的 阶段 ) 多 次 选择 行动 。 也 可 以 允许 少 于 四 个 的 参与 者 :在 
一 些 应 用 中 , 参与 者 3 和 4 就 是 参与 者 1 和 2; 还 有 的 则 不 存在 参与 者 2 或 
参与 者 4。 

我 们 解决 此 类 问题 使 用 的 方法 , 仍 沿用 了 道 向 归纳 的 思路 , 但 这 里 从 博 
弈 的 最 后 阶段 逆向 推导 的 第 一 步 就 包含 了 求解 一 个 真正 的 博弈 (给 定 第 一 
阶段 结果 于 , 参与 者 3 和 4 在 第 二 阶段 同时 行动 的 博 突 ), 而 不 再 是 前 一 节 
求解 单 人 最 优化 的 决策 问题 。 为 使 问题 简化 , 本 节 中 我 们 假设 对 第 一 阶段 
博弈 每 一 个 可 能 结果 (a1, az), 其 后 (参与 者 3 和 4 之 间 的 ) 第 二 阶段 博弈 有 
惟一 的 纳 慎 均衡 ,表示 为 (a3 Caia) ag Cai 42))。 在 第 2.3.A 节 ( 关 于 
重复 博弈 ) 我 们 考虑 放松 这 一 假定 时 的 应 用 。 

如 果 参 与 人 1 和 2 预测 到 参与 人 3 和 4 在 第 二 阶段 的 行动 将 由 {a3 
Caraz) ag (a1s42)) 给 出 , 则 参与 人 1 和 2 在 第 一 阶段 的 问题 就 可 用 以 下 
的 同时 行动 博弈 表示 : 

1. 参与 人 1 和 2 同时 从 各 自 的 可 行 集 4, 和 A, 中 选择 行动 a 和 az; 

2. 收益 情况 为 xifat azaz (asaz) as (ay,a2)}), i=1,2; 

假定 (er ,az ) 为 以 上 同时 行动 博弈 惟一 的 纳什 均衡 ,我 们 称 (ar , a2 ， 
aar,az)j atar ai)) 为 这 一 两 阶段 博弈 的 子 博 弈 精炼 解 。 此 解 与 
完全 且 完 美博 弈 中 的 逆向 归纳 解 在 性 质 上 是 一 致 的 , 并 且 与 后 者 有 着 类 似 


O 和 前 一 节 中 相同 ,参与 者 3 和 4 在 第 二 阶段 的 可 行 筑 4; 和 A,, 可 以 依 闵 于 第 一 阶段 的 结 
Flan ar) 在 特定 条 件 下 , 可 以 存在 (a,, a E ARS 
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的 优点 和 不 足 。 如 果 参 与 者 3 和 4 威胁 在 后 面 的 第 二 阶段 博弈 中 , 他 们 将 
不 选择 纳什 均衡 下 的 行动 , 参与 人 1 和 2 是 不 会 相信 的 .因为 当 博 弈 确实 进 
行 到 第 二 阶段 时 , 参与 人 3 和 4 中 至 少 有 一 个 人 不 愿 把 威胁 变 为 现实 (恰好 
是 因为 它 不 是 第 二 阶段 博弈 的 纳什 均衡 )。 另 一 方面 , 假设 参与 者 1 就 是 参 
与 者 3, 并 且 参 与 者 1 在 第 一 阶段 并 不 选择 af ,参与 者 4 就 会 重新 考虑 参 
与 者 3( 即 参与 者 1) 在 第 二 阶段 将 会 选择 a3 (al, a2) 的 假定 。 


2.2.B 对 银行 的 挤 提 


两 个 投资 者 每 人 存 人 银行 一 笔 存款 D, 银行 已 将 这 些 存款 投入 一 个 长 
期 项 目 。 如 果 在 该 项 目 到 期 前 银行 被 迫 对 投资 者 变现 , 共 可 收回 2r, 这 里 
卫 >r> D/2。 不 过 ,如 果 银 行 允 许 投资 项 目 到 期 , 则 项 目 共 可 取得 2R, 这 
BR>D. 

有 两 个 日 期 ,投资 者 可 以 从 银行 提 款 ;日 期 1 在 银行 的 投资 项 目 到 期 之 
前 ,日 期 2 则 在 到 期 之 后 。 为 使 分 析 简化 , 假设 不 存在 贴现 。 如 果 两 个 投资 
者 都 在 日 期 1 提 款 , 则 每 人 可 得 到 ,博弈 结束 。 如 果 只 有 一 个 投资 者 在 日 
期 1 提 款 , 他 可 得 到 D, 另 一 人 得 到 2r 一 了 ,博弈 结束 。 如 果 两 人 都 不 在 日 
期 1 提 款 , 则 项 目 结束 后 投资 者 在 日 期 2 进行 提 款 决策 。 如 果 两 个 投资 者 
都 在 日 期 2 BA, 则 每 人 得 到 尽 , 博 弈 结束 。 如 果 只 有 一 个 投资 者 在 日 期 2 
ER, 则 他 得 到 2R - D, 另 一 人 得 到 了 ,博弈 结束 。 最 后 , 如 果 在 日 期 2 两 
个 投资 者 都 不 提 款 , 则 银行 向 每 个 投资 者 返还 R ,博弈 结束 。 

我 们 将 在 第 2.4 节 讨 论 此 类 宣 弈 的 正式 表述 方法 ,这 里 只 是 一 般 性 地 
分 析 这 一 问题 的 解决 思路 。 两 个 投资 者 在 日 期 1 和 日 期 2 的 收益 情况 ( 作 
为 他 们 在 那 时 提 款 决策 的 函数 ), 可 以 用 下 面 的 两 个 标准 式 博弈 表示 。 注 意 
这 里 日 期 1 的 标准 式 博弈 是 不 规范 的 :如 果 在 日 期 1 两 个 投资 者 都 选择 不 
BER, 则 没有 与 之 对 应 的 收益 , 这 时 投资 者 要 继续 进行 日 期 2 的 博弈 。 


EK 不 提 RK 不 提 
HER rr D,2r-D 提 款 RR 2R-D,D 
不 提 | 2r-D,D | 下 一 阶段 不 提 | D,2R -D R,R 
日 期 1 日 期 2 


我 们 从 后 往 前 分 析 此 博弈 。 先 考虑 日 期 2 的 标准 式 博弈 。 由 于 R>D 
GEA AIL 2R-D>R), “RR PORE RRR, 那么 这 一 博 突 有 
惟一 的 纳什 均衡 :两 个 投资 者 都 将 提 款 , 最 终 收 益 为 (只 , R)。 由 于 不 存在 
贴现 , 我 们 可 以 直接 用 这 一 收益 替 入 日 期 1 的 标准 式 博弈 双方 都 不 担 款 时 
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HOt mA 2.2.1. hF r<DO RHA 2r- D< r), ik 
两 阶段 博弈 变形 得 到 的 单 阶 段 博弈 存在 两 个 纯 战 略 纳什 均衡 :(1) 西 个 投资 
者 都 提 款 ,最 终 收 益 情 况 为 (r,r);(2) 两 个 投资 者 都 不 提 堵 ,最 终 收 益 为 
(R, Ry。 从 而 ,最 初 的 两 阶 段 银 行 挤 提 博 弈 就 有 源 个 子 博弈 精炼 解 (因此 
也 不 完全 符合 第 2.2.A 节 所 定义 的 博弈 类 型 ):(1) 两 个 投资 者 都 在 日 期 1 
提 款 ,两 人 的 收益 分 别 为 (r, >);(2) 两 个 投资 者 都 不 在 日 期 1 提 款 , 而 在 日 
期 2 提 款 ,两 人 在 日 期 2 的 收益 分 别 为 (R, R})。 


ER 不 提 
RK rr |D,2r-D 
不 提 |2r-D,D| RR 
图 2.2.1 


前 一 种 结果 可 以 解释 为 对 银行 的 一 次 挤 提 。 如 果 投 资 者 1 相信 投资 者 
2 将 在 日 期 1 提 款 , 则 投资 者 的 最 优 反 应 也 是 去 提 款 ,即使 他 们 等 到 日 期 
2 再 去 提 赦 的 话 两 人 的 福利 都 会 提高 。 这 里 的 银行 挤 提 搏弈 在 一 个 很 重要 
的 方面 不 同 于 第 1 章 中 讨论 的 囚徒 困境 ;虽然 两 个 博弈 都 存在 一 个 对 整个 
社会 是 低 效 率 的 纳什 均衡 ;但 在 囚徒 困境 中 这 一 均衡 是 惟一 的 (并 且 是 参与 
者 的 严格 占 优 战略 ), 而 在 这 里 还 同时 存在 另 一 个 有 效率 的 均衡 。 共 而 ,这 
一 模型 并 不 能 预测 何 时 会 发 生 对 银行 的 挤 提 , 但 的 确 显示 出 挤 担 会 作为 一 
个 均衡 结果 而 出 现 。 参 见 戴 蒙 德 入 迪 布 维 格 (1983) 内 容 更 丰富 的 模型 。 


2.2.0 关税 和 国际 市 场 的 不 完全 竞争 


下 面 我 们 讨论 国际 经 济 学 中 的 一 个 应 用 。 考 虑 两 个 完全 相同 的 国家 。 
分 别 用 i=1,2 表示 。 每 个 国家 有 一 个 政府 负责 确定 关税 税率 , 一 个 企业 制 
造 产品 供给 本 国 的 消费 者 及 出 口 , 和 一 群 消费 者 在 国内 市 场 购买 本 国企 业 
或 外 国企 业 生产 的 产品 。 如 果 { 国 家 i 的 ) 市 场 上 总 产量 为 Q, 则 市 场 出 清 
价格 为 p;( Qi) = a - Qi, 国 家 i 中 的 企业 (后 面 称 为 企业 ;) 为 国内 市 场 生 
E pi, 并 出 口 ei, 则 Q=hi+ ej。 企 业 的 边际 成 本 为 常数 c, 并且 没有 固定 
成 本 , 从 而 ,企业 ; 生产 的 总 成 本 为 Cj (hi, e) = c Chi te), 另外 ,产品 出 口 
时 企业 还 要 承担 关税 成 本 (费用 ): 如 果 政 府 ; 制定 的 关税 税率 为 5, 企业 i 
向 国家 j Oe, 必须 支付 关税 zze: 给 政府 j。 

博 蛮 的 时 间 上 顺序 如 下 :第 一 ,政府 同时 选择 关税 税率 2, 和 12; 第 二 , 企 
业 观 察 到 关税 税率 , 并 同时 选择 其 提供 国内 消费 和 出 口 的 产量 (h1, el) 和 
(h2,e2); 第 三 ,企业 i 的 收益 为 其 利润 额 ,政府 i 的 收益 则 为 本 国 总 的 福 


wa vd 
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利 ,其 中 国家 i 的 总 福利 是 国家 i 的 消费 者 享受 的 消费 者 剩余 、? 企业 i 赚 
取 的 利润 以 及 政府 ; 从 企业 j 收取 的 关税 收入 之 和 : 
mil tis tjs hiv ein hjs ej) =la (hite) Ya tla — (et he, 
Delhite) te ， 


wi (tis tjs iseis Ajse) =tai+ itis tjs hiser» his ey) + tej ， 
假设 政府 已 选 定 的 税率 分 别 为 1 和 ee, MRC AL ef Ay. ef ) 为 其 余 
部 分 企业 1 和 企业 2 的 (两 市 场 ) 博 弈 的 纳什 均衡 , 对 每 一 个 企业 i, (AZ, 
er ) 必 须 满 足 
max mi(tis ts hes es hi ej). 
由 于 att hick} ef ) 可 以 表示 为 企业 i 在 市 场 i 的 利润 与 在 市 场 } 
的 利润 之 和 和, 而 企业 i 在 市 场 i 的 利润 只 是 及 Me? 的 函数 ,在 市 场 ; 的 利 
润 又 只 是 e;,h7 We, 的 函数 ,企业 i 在 两 市 场 的 最 优化 问题 就 可 以 简单 地 
拆 分 为 一 对 问题 , 在 每 个 市 场 分 别 求解 : ”必须 满足 ， 
ee 一 (+e De 
He? 必须 满足 
maxe:la = (ei +A?) =c] = tje y 
假设 e; 所 a 一 <, 可 得 
his a-e =o). (2.2.1) 
同时 假设 As <a 一 c 一 上 ,可 得 
ef =F a-h] -ce-6). (2.2.2) 
《从 我 们 求 得 的 结果 来 看 , 和 上 面 两 个 假设 是 相符 的 ) 对 每 一 个 ;= 1,2, 都 
必须 同时 满足 (2.2.1) 和 (2.2.2) 两 个 最 优 反应 函数 , 从 而 我 们 对 四 个 未 知 
数 (h? erhi e ) 就 得 到 了 四 个 方程 式 。 但 由 于 这 四 个 方程 可 分 为 两 
组 ,每 两 个 方程 包含 两 个 未 知 数 , 求解 十 分 容易 。 其 解 为 : 


«a7 ert; » _a7e728; 
有 He; a S (2.2.3) 


O MREMEN pp HR RR OA, MEER o- pM, 
ER RBM Pi{ Qi) = < - Q, 如 果 市 场 i 销售 的 总 产量 为 Q;, 则 总 的 消费 者 剩余 可 表示 为 TAX2》 
Qe 


so PERE iG hy 


比较 第 1.2.A TH Tr ae EE BB ab ie BR HEARE a 一 
0/3, 但 这 一 结果 是 基于 对 称 的 边际 成 本 而 推出 的 。 而 (2.2.3)} 式 的 均衡 
结果 与 之 不 同 的 是 ,政府 对 关税 的 选择 使 企业 的 边际 成 本 不 再 对 称 ( 正 如 习 
题 1.6 的 情况 ), 例 如 在 市 场 i, 企业 i 的 边际 成 本 是 c, 但 企业 j 的 边际 成 
本 则 是 c+ no APEE j 的 成 本 较 高 , EEEN HEEE E. mR 
企业 j 要 降低 产 出 , 市场 出 清 价 格 又 会 相应 提高 ,于 是 企业 i 又 倾向 于 提高 
产 出 ,这 种 情况 下 , 企业 j 的 产量 就 又 会 降低 。 结 果 就 是 在 均衡 条 件 下 , hh》 
Bn 的 提高 而 上 升 , ef Mie; 的 提高 而 (以 更 快 的 速度 ) 下 降 。 这 一 点 可 以 
从 {2.2.3) 式 的 结果 中 明白 看 出 。 

在 解 出 了 政府 选 定 关税 时 , 其 后 第 二 阶段 两 企业 博弈 的 结果 之 后 ,我们 
可 以 把 第 一 阶段 政府 癌 的 互动 决策 表示 为 以 下 的 同时 行动 博弈 :首先 ,政府 
同时 选择 关税 税率 t1 和 tz; 第 二 ,政府 i 的 收益 为 Wi(ti, tj RY ,er hio 
ei ),¢=1,2, RE A} Me? 是 (2.2.3) 式 所 表示 的 t; Me 的 函数 。 现 在 我 

们 求解 这 一 政府 癌 博弈 的 纳什 均衡 。 

为 简化 使 用 的 表示 符号 ,我 们 把 AS RET i er 决定 于 5 隐 于 式 中 ， 
SWI BR Wie ty At er Ag, ed ), 即 当政 府 i 选择 关税 吉政 
RE gj ARKE, DW i 和 j 按 (2.2.3) 式 中 的 纳什 均 本 选择 行动 时 政府 i 
Wiii MRI, ir ) 是 这 一 政府 间 博 弈 的 纳什 均衡 , 则 对 每 一 个 i, 7 
必须 满足 


max Wi (ents) x 
BW iX ETF 


(are) u? lazet} (amem2 Y | tase 24) 


18 9 9 3 ss 


于 是 


这 一 结果 对 每 一 个 i 都 成 立 , 并 不 依赖 于 t;”。 也 就 是 说 ,在 本 模型 中 , 选择 
(a — c)/3 的 关税 税率 对 每 个 政府 都 是 占 优 战略 (在 其 他 模型 中 , 比如 当 边 
际 成 本 递增 时 , 政府 的 震 衡 战略 就 不 是 上 古 优 战略 )。 把 4? = +t) = (a 一 <)/3 
代入 (2.2.3) 式 可 得 

hdMese) 有 oes 
这 就 得 到 企业 第 二 阶段 所 选择 的 产 出 ,至 此 , 我 们 已 求 得 这 一 关税 博弈 的 子 
RRR Gr Hef =(a—c)/B, kf =h} =4(a~c)/9, er =e2 =(a 


~c)/9)。 

在 子 博 弈 精炼 解 中 ,每 一 市 场 上 的 总 产量 为 5(a - c)/9。 进 一 步 分 析 
我 们 会 发 现 ,如 果 政 府 选 择 的 关税 税率 为 0, 则 每 一 市 场 上 的 总 产量 将 为 2 
(a ~- c)/3, 等 于 古 诺 模 型 的 结果 。 从 而 ,市 场 i 的 消费 者 剩余 (上 注 中 已 说 
明 , 它 简单 地 等 于 市 场 ; 的 总 产量 平方 的 一 半 ), 在 政府 选择 其 占 优 战略 时 ， 
比 选择 0 关税 税率 时 要 低 , 事实 上 , 为 0 的 关税 税率 是 社会 最 优选 择 , 因为 
=t, =O 是 下 式 的 解 

mag, Wi (tas £2) + WE (ta, t) - 


于 是 ,政府 就 有 动因 签订 一 个 相互 承诺 0 关税 税率 的 协定 4 即 自 由 贸 
易 )。( 如 果 负 关税 税率 , 即 补贴 , 是 可 行 的 ,社会 最 优化 的 条 件 是 政府 选择 
2=tz=-(e 一 ce), 这 使 得 国内 企业 为 本 国 消费 者 提供 的 产 出 为 0, SRS 
一 国家 出 口 完全 竞争 条 件 下 的 产量 ) 这 样 , 由 于 企业 ; 和 j EO 
《2.2,.3)? 给 出 的 纳什 均衡 结果 行动 ,政府 在 第 一 阶段 的 互动 决策 就 成 为 囚徒 
困境 式 的 问题 ;惟一 的 纳什 均衡 是 其 占 优 战略 ,但 对 整个 社会 却 是 低 效 率 
的 。 


2.2.D 工作 竞赛 


考虑 为 同一 老板 工作 的 两 个 工人 ,工人 (其 中 i 等 于 或 2) 生 产 的 产 
出 y; = ete, EP ce 是 努力 程度 , ¢ 是 随机 扰动 项 。 生产 的 程序 如 下 :第 
一 ,两 个 工人 同时 选择 非 负 的 努力 水 平 0:0; W, 随机 扰动 项 e， 和 sz 相 
互 独立 , 并 了 服从 期 望 值 为 0、 密度 函数 为 f(e) 的 概率 分 布 ;第 三 , 工人 的 产 
出 可 以 观测 ,但 各 自选 择 的 努力 水 平 无 法 观测 , 类 而 工人 的 工资 可 以 决定 于 
各 人 的 产 出 , 却 无 法 (直接 ) 取 决 于 其 努力 水 平 。 

假设 老板 为 激励 工人 努力 工作 , 而 在 他 们 中 间 开 展 工 作 竞赛 , 参见 拉 齐 
尔 和 罗 森 (1981) 首 先 建立 的 分 析 模 型 9。 工作 竞 琳 的 优胜 者 ( 即 产 出 水 平 
较 高 的 工人 ) 获 得 的 工资 为 wu; 失败 者 的 工资 为 wz。 工 人 获得 工资 水 平 
w 并 付出 努力 程度 e 时 的 收益 为 wkKw,e)=w-&g(e) ,其 中 &(e) 表 示 努 力 
工作 带 来 的 负 效用 , 是 递增 的 凸 函 数 ( 即 g(e)>0 且 g (ce)>0)。 老 板 的 
收益 为 yi + yz 一 wa- wro 

现在 我 们 套用 对 第 2.2.A 节 博 弈 类 型 的 讨论 思路 来 分 析 这 一 应 用 。 


O ”为 使 对 这 一 应 用 的 分 析 保 持 简洁 . RNG TIL ERAY, 比如 保证 工人 的 一 阶 条 梓 充 
分 性 的 条 件 。 不 过 ,分 析 过 程 仍 比 前 面 的 鲍 于 涉及 到 更 克 的 概率 论 知识 。 读 者 也 可 以 峡 过 这 一 应 
用 ,而 不 会 影响 理解 的 连贯 性 。 
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老板 为 参与 者 1, 他 的 行动 a, 是 选择 工作 竞赛 中 的 工资 水 平 wa Mw, 3X 
里 不 存在 参与 者 2。 两 个 工人 是 参与 者 3 和 4, 他 们 观测 第 一 阶段 选 定 的 工 
资 水 平 ,然后 同时 选择 行动 a, 和 a, 具体 地 说 就 是 选 定 的 努力 程度 el 和 
e2。( 后 面 我 们 将 考 虚 另 一 种 可 能 性 ,就 是 对 老板 选 定 的 工资 水 平 ,工人 们 
不 愿意 参与 工作 竞赛 , 却 转 而 寻找 另外 的 工作 机 会 ) 最 后 , 参与 者 各 自 的 收 
益 如 前 面 所 给 出 。 由 于 产 出 (并 由 此 而 使 工资 ) 不 只 是 参与 者 行动 的 函数 ， 
而 且 同 时 还 爱 随机 扰动 因素 es; Me. 的 影响 , 我 们 用 参与 者 的 期 望 收益 进 
行 分 析 。 

假定 老板 已 选 定 了 工资 水 平 wy 和 wi, 如 果 一 对 努力 水 平 (er , ez ) 是 
第 二 阶段 西 工 人 博弈 的 纳什 均衡 , 则 对 每 个 i, e” 必须 使 工人 的 期 望 工资 
咸 去 努力 带 来 的 负 效 用 后 的 净 收益 最 大 , 亦 即 e? 必须 满足 :了 

max wnHProb| yi(ei) > 4; (e7 XH+ wiProbly, (el) Ey ler) - gle) 


= (wy wr)Probly(e) > yle? J} + w- gee) - (2.2.4) 
其 中 gle = eit ero (2.2.4) 的 一 阶 条 件 为 


(oy) m) SPB Laie)? abe Mn oe) i (2.2.5) 


也 就 是 说 , 工人 i 选择 努力 程度 。, 从 而 使 得 额外 努力 的 边际 负 效 用 sg- 
Cei), 等 于 增加 努力 的 边际 收益 , 后 者 又 等 于 对 优胜 者 的 奖励 工资 wy- 
ro* 委 以 因 努 力 程度 提高 而 使 获胜 概率 的 增加 。 

根据 贝 叶 斯 法 则 人 

Probi y,(e,) > y;(ej )| =Proble; > ej +e;- eil 


= Í Probie; > e; + ¢; — e: | €;) flej)dej 
6 


-| [1- Fle; — e+e)]fle)de, , 
y 
于 是 ,一 阶 条 件 (2.2.5) 可 化 为 


O 在 (2-2-4) 式 中 ,我 们 幅 信 本 一 个 前 握 , 即 息 定 随机 扰动 项 的 窗 度 f(s) 演 足 两 个 工人 产 出 
水 平 刚 好 相等 的 概率 为 0, 从 而 在 求 得 王 人 # 期 望 获 用 时 不 必 考 虑 这 种 情况 。( 较 正式 地 说 , RIE 
定 密度 函数 /(e) 没 有 奇 点 ) 在 对 工作 竞赛 的 完全 分 析 中 , SAT Re eS RA 
型 中 是 等 价 的 ) 每 个 工人 得 到 (twn + w )/2 的 情况 是 十 分 自然 的 {但 对 结果 却 无 关 紧 要 )。 

STWR TOR A DHAR MEER B 已 经 发 生 亲 件 下 事件 4 发 生 的 (条 
忻 ) 概 率 。 令 pA) pDA p{A,B) 分 别 表示 A RE BREMA BARRERA MR 
A 和 日 都 没有 机 会 发 生前 的 主观 邮 率 )。 贝 叶 斯 法 则 证 明 p(AlB)= p(A,B)/p(B)。 也 就 是 说 ， 
BRERA 发 生 的 条 件 概率 等 于 A HB 同时 发 生 的 慨 率 除 以 B REE, 
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Cond f fle? -e + a) fede; = glei) . 
在 对 称 的 纳什 均衡 ( 即 e? ef =e"), 我 们 有 
Cw wr) f fle; )2de; = gle"). (2.2.6) 


由 于 gf(e) 是 凸 函数 , PERS MR wy- w, 的 值 越 大 ), 就 会 激 
发 更 大 的 努力 ,这 和 我 们 的 直觉 是 一 致 的 。 另 一 方面 , 在 同样 的 奖励 水 平 
下 ,对 产 出 的 随机 挑动 因素 越 大 , 越 不 值得 努力 工作 , 因为 这 时 工作 竞赛 的 
最 终结 果 在 很 大 程度 上 是 决定 于 运气 ,而 非 努 力 程度 。 例 如 , 当 服从 方差 
Ao? HESAN, WA 

1 


MOLE 

它 随 o 的 增加 而 下 降 , 也 就 是 说 e” 的 确 随 o 的 增加 而 降低 。 

下 面 我 们 从 后 往 前 分 析 博 弈 的 第 一 阶段 。 假 定 工人 们 同意 参加 工作 竞 
赛 (而 不 是 去 另 谋 高 就 ), 他 们 对 给 定 的 wy 和 zl 的 反应 ,将 会 是 (2.2.6) 
描述 的 对 称 的 纳什 均衡 战略 。( 从 而 我 们 忽略 掉 存在 不 对 称 均衡 的 可 能 性 ， 
以 及 工人 的 努力 程度 由 角 解 e1 = ez= 0 而 不 是 由 一 阶 条 件 (2.2.5) 给 出 的 
可 能 性 ) 同 时 假定 工人 可 寻求 其 他 就 业 机 会 ,得 到 的 效用 为 U,。 因 为 在 对 
称 的 纳什 均衡 中 每 个 工人 在 竞赛 中 获得 优胜 的 概率 为 /2( 即 )Prob | y; 
(eo? )>w%(e*)1= 1/2), 如 果 老 板 要 使 工人 有 动力 参加 工作 竞赛 , 则 他 必须 
选择 满足 下 式 的 工资 水 平 


fet Fw- gle BU, 7 (2.2.7) 


假设 U, EBR, 以 致 于 老板 愿意 激励 工人 参加 竞赛 , 则 他 会 在 (2.2.7) 的 
约束 条 件 下 ,选择 使 自己 期 望 收益 2e”- wy- wi 最 大 的 工资 水 平 。 由 于 
在 最 优 条 件 下 , (2.2.7) 中 的 等 号 成 立 ， 

wy =2U,+2¢(e*)— wy. (2.2.8) 
则 期 望 利润 就 成 为 2e* —2U, - 2g (e* ), 于 是 老板 要 考虑 的 问题 就 是 使 
e"-g(e") 最 大 化 ,这 时 他 选择 的 工资 水 平 应 使 得 与 之 相应 的 。* 满足 这 
一 杂 忻 。 从 而 最 优选 择 下 的 努力 程度 满足 一 阶 条 件 ge'(e") = 1, 将 其 代入 
{2.2.6) 则 意味 着 最 优 激励 wp w 满足 

(wp 一 wf fg Pde, = 1 

es 


和 (2.2.8) 一 起 ,可 解 得 wy Mw, 的 值 。 
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2.3 BSB 


本 节 我 们 分 析 在 参与 者 之 间 长 期 重复 的 相互 往来 中 , 关于 将 来 行动 的 
威 肪 或 承诺 能 否 影 响 到 当前 的 行动 。 大 部 分 直观 的 结论 是 由 两 阶段 的 例子 
给 出 的 ,也 有 一 些 观 点 需要 讨论 无 限 次 的 情况 。 同 时 ,我 们 还 将 定义 重复 博 
弈 中 子 博 弈 精炼 纳 仕 均衡 的 概念 .这 一 定义 在 重复 博弈 的 条 件 下 表述 较 容 
易 理解 ,而 在 第 2.4.B 节 分 析 一 般 的 完全 信息 动态 博弈 中 则 要 复杂 一 些 。 
我 们 在 本 节 先 作 一 简要 介绍 , 以 方便 后 面 的 展开 。 


2.3.A 理论 :两 阶段 重复 博 赛 


考虑 图 2.3.1 给 出 的 因 徒 困境 的 标准 式 , 假设 两 个 参与 者 要 把 这 样 一 
个 同时 行动 福 弈 重复 进行 两 次 , 县 在 第 二 次 博弈 开始 之 前 可 观测 第 一 次 进 
行 的 结果 , 并 假设 整个 过 程 博弈 的 收益 等 于 两 阶段 各 自 收 益 的 简单 相 加 ( 即 
不 考虑 贴现 因素 ), 我 们 称 这 一 重复 进行 的 博弈 为 两 阶段 四 徒 困境 。 它 属于 
第 2.2.A 节 分 析 过 的 博弈 类 型 ,这 里 参与 者 3、4 与 参与 者 1、2 是 相同 的 ， 
行动 空间 A 和 A, 也 与 4 改 4z 相同 ,并 且 总 收益 Ula, az as a) FF 
第 一 阶段 结果 (a1, a2) 的 收益 与 第 二 阶段 结果 (as, a4) 的 收益 简单 相 加 。 
而 且 , 两 阶段 四 秆 困境 满足 我 们 在 第 2.2.A 节 所 作 的 假定 :对 每 一 个 第 一 
阶段 的 可 行 结果 (ai, az), 其 余部 分 在 参与 者 3 和 4 之 间 进 行 的 博弈 都 存在 
惟一 的 纳什 均衡 ,表示 为 (cz Caraz), ad (ai az))。 事 实 上 ,两 阶段 囚徒 
困境 满 是 比 上 述 假定 更 为 严格 的 条 件 : 在 第 2.2.A 节 中 ,我 们 允许 其 余 第 
二 阶段 博弈 的 纳什 均衡 依赖 于 第 一 险 段 的 结果 -~ 一 众 而 我 们 表示 为 (cy 
(au az)yaz (aiyaz)), 而 不 是 简单 的 (ay , a? ) (例如 在 关税 博弈 中 , 第 二 
阶段 企业 选择 的 均衡 产量 决定 于 政府 在 第 一 阶段 所 选择 的 关税 ), 但 在 两 阶 
眉 四 徒 困境 中 , 第 二 阶段 博弈 惟一 的 纳什 均衡 就 是 (Li, 工 ;) ,不管 第 一 阶段 
的 结果 如 何 。 
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根据 在 第 2.2.A 节 讲 过 的 求解 此 类 博 变 子 博弈 精炼 解 的 程序 , 第 二 阶 
上段 博 变 的 结果 为 该 阶段 所 余部 分 博弈 的 纳什 均衡 , 在 本 例 中 , 即 为 ( 工 ， 
La), 两 人 收益 为 (1,1), 我 们 在 此 前 提 下 分 析 两 阶段 囚徒 困境 第 一 阶段 的 
情况 。 由 此 , 两 阶段 囚徒 困境 中 , 参与 者 在 第 一 阶段 的 局 势 就 可 归纳 为 图 
2.3.2 所 示 的 一 次 性 博弈 , 其 中 , 第 二 阶段 的 均衡 收益 (1,1) 分 别 被 加 到 两 
人 第 一 阶段 每 一 收益 组 合 之 上 。 图 2.3.2 所 示 的 博弈 同样 有 惟一 的 纳什 均 
衡 ;(L1, 工 ,)}。 从 而 ,两 阶段 因 徒 困境 惟一 的 子 博弈 精炼 解 就 是 第 一 阶 眉 的 
(Li, 2) 和 随后 第 二 阶段 的 (L1, Laz)。 在 子 博弈 精炼 解 中 , 任 一 阶段 都 不 
能 达成 相互 合作 一 一 (Ri R2) 的 结果 。 

这 一 结论 在 更 为 一 般 的 条 件 下 同样 成 立 ( 这 里 我 们 暂时 离开 两 阶段 的 
例子 , 允许 任何 有 限 的 了 KEZ). $ G= [A s Anita) us| 表示 一 
个 完全 信息 博弈 ,其 中 参与 者 1 到 n 同时 从 各 自 的 行动 空间 A 到 A, 中 分 
别 选 择 行动 a1 到 a,, 得 到 的 收益 分 别 为 tilar, t, an), ts Halan ta 
a) 此 后 我 们 称 博弈 CARRE RR, 


定义 ”对 给 定 的 阶段 博弈 G, 令 G(T) 表 示 G BRENT KHARE 
复 博弈 ,并 和 且 在 下 一 次 博弈 开始 前 ,所 有 以 前 博弈 的 进行 都 可 被 观测 到 。G 
〈T) 的 收益 为 工 次 阶段 搏弈 收益 的 简单 相 加 。 


定理 ”如果 阶 段 博弈 G 有 惟一 的 纳什 均衡 , 则 对 任意 有 限 的 下, 重复 
博弈 G(T) 有 惟一 的 子 博 弈 精炼 解 ; 即 G 的 纳什 均衡 结果 在 每 一 阶段 重复 
进行 -中 


O ERREF G 为 完全 信息 动态 博弈 时 类 似 结论 同样 成 立 。 设 G 属于 第 2.1. 生 节 所 定义 
的 完全 且 完 美 信息 动态 博弈 , 如果 G 有 惟一 的 逆向 归纳 解 , 则 GCT) 有 惟一 的 子 祖 弈 精炼 解 :其 中 
每 一 阶段 的 结果 都 是 G 的 逆向 归纳 解 。 类 似 地 , 设 G 为 第 2.2.A 节 定 义 的 两 阶段 博 诗 , 如 果 G 有 
惟一 的 子 博弈 精炼 解 . 则 G(T 了 ) 也 有 惟一 的 地 博弈 精炼 解 :G 的 子 博弈 精炼 解 重复 进行 工 次 。 
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现在 ,我 们 回 到 两 阶段 博弈 ,进一步 考虑 阶段 博弈 G 有 多 个 纳什 均衡 
的 情况 ,如 图 2.3.3 所 示 。 战 略 L; MM 与 图 2.3.1 所 示 的 囚徒 困境 完全 
相同 , 只 不 过 增加 了 战略 R 使 博弈 有 了 两 个 纯 战 略 纳什 均衡 :其 一 是 囚徒 
困境 中 的 (L1, Lo), 另外 还 有 (Ri, Ro). XA AT PSE E A D EY E 
加 了 一 个 均衡 解 当然 是 很 主观 的 , 但 在 此 博弈 中 我 们 的 兴趣 主要 在 理论 上 ， 
而 非 其 经 济 学 意义 。 在 下 一 节 我 们 将 看 到 , 即使 重复 进行 的 阶段 博弈 像 四 
徒 的 困境 一 样 有 惟一 的 顷 什 均衡 , 但 当 重复 博弈 无 限 次 进行 下 去 时 , 仍 表现 
出 这 里 斯 分 析 的 多 均衡 特征 。 从 而 , 本 节 我 们 在 最 简单 的 两 阶段 情况 下 分 
壬 一 个 抽象 的 阶段 博弈 ,以 后 再 分 析 由 有 经 济 学 意义 的 阶段 请 弈 梅 成 的 无 
限 重复 博弈 也 就 十 分 容易 了 。 

设 图 2.3.3 表示 的 阶段 博弈 重复 进行 两 次 , 并 在 第 二 阶段 开始 前 可 以 
观测 到 第 一 阶段 的 结果 ,我 们 可 以 证 明 在 这 一 重复 博弈 中 存在 一 个 子 博弈 
精炼 解 ,其 中 第 一 阶段 的 战略 组 全 为 (Mi, M2) 93。 和 第 2.2-A 节 相同 , B 
定 在 第 一 阶段 参与 者 预测 第 二 阶段 的 结果 将 会 是 下 一 阶段 博弈 的 一 个 纳什 
均衡 , 由 于 这 里 阶段 博 容 有 不 止 一 个 纳什 均衡 ,因而 参与 者 可 能 会 预测 根据 
第 一 阶段 的 不 同 结果 ,在 第 二 阶段 的 博弈 中 将 会 出 现 不 同 的 纳什 均衡 。 例 
如 , 设 参与 者 预测 如 果 第 一 阶段 的 结果 是 ( Mi, Ma), 第 二 阶段 的 结果 将 会 
是 (Ri1, Ro), 而 如 果 第 一 阶段 中 其 他 8 个 结果 的 任何 一 个 出 现 , 第 二 阶段 的 
结果 就 将 会 是 (Li,L2), 那 么 参与 者 在 第 一 阶段 所 面临 的 局 势 就 可 旨 为 图 
2.3.4 所 示 的 一 次 性 博弈 ,其 中 在 (M3, M2) 单 元 加 上 了 (3, 3), 在 其 余 8 个 
单元 各 加 上 {1,1)。 


外 ”严格 地 讲 ,我 们 只 针对 第 2.2.A TELERA EN T TER ARE, 两 阶段 囚徒 困境 
属于 这 一 类 型 ,因为 对 每 一 个 第 一 阶段 博弈 的 可 行 结果 ,其余 第 二 阶段 博弈 都 有 惟一 的 纳什 均 生 。 
而 基于 图 2.3.3 为 阶段 博 弃 的 两 阶段 重复 沪 主 不 属于 这 一 类 型 ,因为 其 阶段 博 灾 有 多 个 纳什 均衡 。 
这 里 ,我们 不 对 子 博 弈 精炼 解 的 定义 进行 专门 扩展 ,使 之 适用 于 所 有 两 阶段 博 穿 , 其 一 因为 定义 所 
需 的 变动 极 微 ;其 二 , 在 第 2.3.B 节 和 第 2.4.B 节 中 将 会 用 到 更 为 一 般 的 定义 。 
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Lz Mz Ri 


Ly 2,2 6,1 At 
Mı 1.6 7,7 1,1 


1,1 14 44 


W 2.3.4 


EE 2.3.4 的 博弈 中 有 3 个 纯 战 略 纳什 均衡 :( 工 ，, 工 ?)，《Mi, M2) 和 
CRy,R2)o AEM 2.3.2 中 一 样 ,这 个 一 次 性 搏弈 中 的 纳什 均衡 对 应 着 重 
BOAO TRA. Clw, z),(?y,=) 表 示 重 复 博弈 的 一 个 结果 一 一 
第 一 阶段 和 第 二 阶段 的 行动 分 别 为 (ww, xz) 和 (>,z)。 图 2.3.4 中 的 纳什 均 
衡 (Li,Lz) 对 应 着 重复 博 蛮 的 子 博弈 精炼 解 (( 工 1, Li), (Ly, L2)), 因为 除 
第 一 阶段 的 结果 是 (Mi, M2) 外 ,其 他 任何 情况 发 生 时 , 第 二 阶段 的 结果 都 
将 是 (LEz)。 类 似 地 ,图 2.3.4 FHR R, 了 2z) 对 应 了 重复 博弈 
的 子 博 讲 精 炼 解 {( Ri, Ra) (Ln La) )。 重 复 博弈 的 这 两 个 子 博 弈 精炼 解 都 
简单 地 由 两 个 阶段 博弈 的 纳什 均衡 解 相 串 而 成 , 但 图 2.3.4 里 的 第 三 个 纳什 
均衡 结果 却 与 前 两 者 存在 质 的 差别 :图 2.3.4 中 的 (M1, Mz) 对 应 的 重复 博弈 
子 博 穿 精炼 解 为 ((M1, M2), (Ris Raz)), 因 为 对 (Mu M2) 之 后 的 第 二 阶段 结 
时 预期 是 (Ri, Rz), 亦 即 正如 我 们 前 面 讲 过 的 ,在 重复 博弈 的 于 博弈 精炼 解 
中 ,合作 可 以 在 第 一 阶段 达成 。 下 面 是 更 为 一 般 的 情况 :如 果 G = 141， 
Anun un1 是 一 个 有 多 个 纳什 均衡 的 完全 信息 琵 态 博 弃 , 则 重复 博弈 G 
(T) 可 以 存在 子 博弈 精 炬 解 ,其 中 对 每 一 ;< T,* 阶段 的 结果 都 不 是 G 的 纳 
什 均衡 ,下 一 节 我 们 在 讨论 无 限 重复 博弈 时 还 将 涉及 这 一 理念 。 

这 个 例子 要 说 明 的 主要 观点 是 , 对 将 来 行动 所 作 的 可 信 的 威胁 或 承 
诸 可 以 影响 到 当前 的 行动 。 不 过 另外 一 点 , 也 说 明了 子 博弈 精炼 的 概念 
对 可 信 竹 的 要 求 并 不 严 阁 。 鲍 如 , 在 推导 子 博弈 精炼 解 (( Mi, Mo), 
(Ri, R2)) 时 , 我们 假定 如 果 第 一 阶段 的 结果 是 (M14, Ma), 则 参与 双方 
都 预期 (Ru Ra ) 将 是 第 二 阶段 的 解 ,如果 第 一 阶段 出 现 了 任何 其 他 8 种 
结果 之 一 ,第 二 阶段 的 结果 就 会 是 (Li, 工 :)。 但 是 , 由 于 第 二 阶段 的 博 
FEC, (Ri,Rz) 亦 为 可 选择 的 纳什 均 街 , 而 相应 的 收益 为 (3,3), 这 时 选 
择 收 益 为 {1,1) 的 (Li1, L,) 看 起 来 就 比较 思春 了 。 不 严格 地 看 ,参与 双 
方 进行 重新 谈判 似 平 是 很 自然 的 事 了 。 如 果 第 一 阶段 的 结果 并 不 是 


D 之 所 以 说 不 严格 ,因为 "重新 谈判" 章 味 着 在 第 一 阶 段 和 第 二 阶段 中 间 发 生 了 交流 (甚至 是 
讨价还价 )。 如 果 此 类 行为 是 允许 的 , 则 它们 应 包含 在 对 搏 弃 的 定义 及 分 析 之 中 。 这 里 我 们 假定 没 
有 此 类 行为 发 生 ,因而 “重新 谈判 "在 此 可 理解 为 在 内 心 对 局 势 的 分 析 。 
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(Mi, M2), 从 而 双方 第 二 阶段 的 行动 应 该 是 (Li, LL), 那么 每 一 个 参与 
者 可 能 会 理性 地 认为 过 去 的 反正 已 经 过 去 了 ,在 余下 的 阶段 博弈 中 就 会 
选择 双方 都 偏好 的 均衡 行动 (Ri, Rz)。 但 是 如 果 对 每 个 第 一 阶段 的 结 
果 , 第 二 阶段 的 结果 都 将 是 (Ru R;) 的 话 , 则 第 一 阶段 选择 (M1, Mz) 的 
动机 就 被 酸 坏 了 :两 个 参与 省 在 第 一 阶段 面临 的 局 势 就 可 以 简化 表示 为 图 
2.3.3 所 示 阶 段 博 弈 的 每 一 单元 格 中 的 收益 都 加 上 (3, 3) 后 形成 的 一 次 姓 
博弈 ,于 是 i 对 Mj 的 最 优 反应 就 成 为 工 io 

为 说 明 这 一 重新 谈判 问题 的 解决 思路 , 我 们 考虑 图 2.3.5 所 示 的 博弈 。 
和 图 2.3.3 的 博弈 相 比 , 它 的 人 为 设计 的 痕迹 更 为 明显 。 园 样 ,我们 对 这 一 
博弈 的 分 析 只 为 了 说 明 问 题 , 而 不 考虑 其 经 济 学 含义 , 从 这 一 人 为 博弈 中 我 
们 得 出 的 有 关 重 新 谈判 的 观点 , 亦 可 应 用 于 对 无 限 重 复 博 蛮 中 重新 谈判 的 
分 析 ; 参 见 法 震 尔 罗 和 马 斯 金 (1989) 提 供 的 例子 。 


Ls Ma Rz P: Q 

L, 1,1 5.0 0,0 0,0 0,0 

M, 0,5 4d 0,0 0,0 0,0 

R, 0,0 0,0 33 0.0 0,0 

Pi 0,0 0.0 9.0 ,2 0,0 

Qi 0,0 0,0 0,0 0,0 1/2, 4 

FA 2.3.5 

这 里 的 阶段 博弈 在 图 2.3.3 的 基础 上 又 加 上 了 战略 p; 和 Q,. 从 而 阶 
段 博弈 有 了 四 个 纯 战 略 纳什 均衡 ;( 上 +, 工 ?7) 和 (Ri,RR2) ,同时 又 增加 了 (Pi， 
P,) 和 (Qi, Q2). SEAR, MCL, 上 2) 相 比 ,参与 双方 都 更 倾向 于 选择 


(Ri, R2)。 但 更 重要 的 ,图 2.3.5 的 博弈 中 , 不 存在 一 个 纳什 均衡 (xz, y). 
使 参与 双方 和 (Pl, PARQ, Qz) 或 (Ri Ra) 相 比 ,都 更 倾向 于 选择 (zx， 
y)。 我 们 称 ( Ri, Ry) HRHGF (Pareto-dominates) (上 L1, L2), M E(P}, 
了 P2) (Qi Qz) 和 (Ri Ra) 都 处 于 图 2.3.5 所 示 捕 弈 的 纳什 均衡 收益 的 四 
累 托 边界 (Pareto frontier) 之 上 。 

设想 图 2.3.5 的 阶段 博弈 重复 进行 两 次 , 且 在 第 二 阶段 开始 前 可 以 观 
测 到 第 一 阶段 的 结果 。 进 一 步 假 设 参 与 者 预期 的 第 二 阶段 结果 如 下 :如 果 
第 一 阶段 的 结果 为 ( M1, M2), 第 二 阶段 将 是 (Ri, Ra); 第 一 阶段 (Mi 让) 
其 中 w ARM, 之 外 的 三 意 战略 , 则 ( Py, P:) ;第 一 阶段 (zr, M2), RP a 


HRM, 之 外 的 任意 战略 , 则 (Q1, Q2) ;第 一 阶段 (y, zx), 其 中 y 为 除 Mi 之 
外 的 任何 战略 , x 为 除 Ma 之 外 的 任何 战略 , 则 (RR1, RR2)。 那 么 (MI, M2), 
《Ru Ro) REE EFH Fe PB ee M, 接着 选 R, 每 个 参 
与 者 都 可 得 到 4+ 3 的 收益 ,但 在 第 一 阶段 偏离 这 一 选择 而 选 L, 却 只 能 得 
到 5+1/2( 选 择 其 他 行动 的 收益 其 至 更 慨 )。 更 为 重要 的 是 ,前 一 例 于 中 过 
到 的 困难 在 这 里 并 没有 出 现 。 在 基于 图 2.3.3 的 两 阶段 重复 博弈 中 . 对 一 
个 参与 者 在 第 一 阶段 不 守信 用 的 惩罚 ,只 能 是 在 第 二 阶段 的 帕 累 托 居 劣 均 
衡 ,从 而 同时 惩罚 了 匹 罚 者 。 在 这 里 与 之 不 同 的 是 ,有 三 个 均衡 处 于 帕 累 托 
边界 之 上 一 一 其 中 之 一 可 以 奖励 参与 双方 在 第 一 阶段 的 良好 行动 , 另外 两 
个 则 可 以 在 匹 罚 第 一 阶段 不 守信 用 者 的 同时 ,奖励 每 罚 者 。 从 而 , 一 旦 在 第 
“TRA LER BRA, 惩罚 者 就 不 会 再 考虑 选择 阶段 博弈 的 其 他 均衡 ,于 
是 也 就 无 法 说 服 惩罚 者 就 第 二 阶段 的 行动 进行 重新 谈判 。 


2.3.B Mit: AREAN 


本 节 我 们 回 到 对 无 限 重 复 博弈 的 讨论 。 和 前 面 有 限 重 复 博 弈 的 例子 相 
局, 问题 的 中 心 是 关于 将 来 行动 的 可 信 的 威胁 或 承诺 可 以 影响 到 当前 的 行 
动 。 在 有 限 情况 的 例子 中 我 们 已 看 到 , 如 果 阶 段 博弈 G 有 多 个 纳什 均衡 ， 
重复 博弈 CORTES HET RRR, 其 中 对 任意 :< 工 , 阶段 :的 
结果 都 不 是 G 的 纳什 均衡 。 在 无 限 重复 博 蛮 中 一 个 更 强 的 结论 成 立 : 即 使 
阶段 博弈 有 惟一 的 纳什 均衡 , 无 限 重 复 博 弈 中 也 可 以 存在 子 博 弈 精炼 解 , 其 
中 没有 一 个 阶段 的 结果 是 G 的 纳什 均衡 。 

首先 ,我 们 研究 无 限 重复 的 囚徒 困境 铺 弈 , 接着 诅 讨 论 和 前 一 节 定义 的 
有 限 重复 博弈 类 型 相 词 的 无 限 重复 博弈 ;一 个 完全 信息 静态 博弈 G, 被 无 
限 次 重复 进行 ,并 且 在 下 一 阶段 开始 时 , 之 前 所 有 阶段 的 结果 都 可 以 被 观测 
到 。 对 这 一 类 型 的 有 限 重 复 或 无 限 重复 博弈 , 我 们 定义 参与 者 的 战略 、 子 博 
弈 和 子 博 弈 精炼 纳什 均衡 (在 第 2.4.B 节 , 我 们 对 一 般 的 完全 信息 动态 博 
弈 定义 上 述 概念 , 而 不 仅 包 含 这 一 特定 类 型 的 重复 博弈 )。 些 后 , 我 们 运用 
这 些 硫 念 给 出 并 证 明 弗 里 德 曼 (1971) 的 定理 ( 亦 称 为 无 名 氏 定理 I) 


外 ”开始 时 的 无 名 氏 定理 分 析 工 一 个 有 限 重 复 博 蛮 前 全 部 纳什 均衡 的 收益 。 这 一 结论 筱 称 为 
无 名 氏 定 理 ,是 图 为 尽管 无 人 发 表 ,但 在 50 年 代 就 已 广 为 博 弈 论 学 者 所 知 。 昔 里 乱 时 (1971) 的 定 
理 则 分 析 了 有 限 重 复 博 蛮 的 特定 子 博 弈 精炼 纳什 均衡 的 收益 , 由 于 应 用 了 子 铺 宅 精 炼 纳什 均衡 ,这 
一 较 纳 什 均 街 条 件 更 强 的 均衡 概念 ,因而 较 当 宰 的 无名 氏 定 理 条 件 更 强 。 不 过 当初 的 名 字 依 然 褒 
组 下 来 : 弗 里 牧 肥 的 定理 (和 此 后 的 结论 ) 有 了 时 入 为 无 名 氏 定 理 , 尽管 在 它们 公开 发 表 之 前 并 未 被 博 
RRS SH. 
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参与 省 2 
Ly R: 


L, t1 5,0 
Rz oS ad 


参与 者 1 


图 2.3.6 


设想 图 2.3.6 的 因 徒 困境 将 无 限 次 地 重复 进行 , 并 且 对 每 个 *, 在 第 上 
阶段 开始 前 的 :~ 1 次 阶段 博弈 的 结果 都 可 被 观测 到 。 将 这 无 限 次 阶段 博 
弈 的 收益 简单 相 加 ,对 衡量 参与 者 在 无 限 次 重复 博弈 中 的 总 交 盖 并 无 太 大 
意义 , 比如 每 一 阶 息 得 到 的 收益 为 4 显然 要 优 于 每 一 阶段 得 到 的 收益 为 1， 
但 两 者 之 和 却 都 是 无 穷 大 。 前 面 讲 过 ( 鲁 宾 斯 坦 的 讨价还价 模型 ,第 2.1.D 
节 ) 贴 现 因子 8=1/(1+7r) 为 一 个 时 期 后 的 一 美元 今天 的 价值 ,其 中 + 为 每 
一 阶段 的 利率 。 给 定 一 个 贴现 因子 及 参与 者 在 无 限 次 博弈 中 每 次 的 收益 ， 
我 们 可 以 计算 收益 的 现 信 一 一 如 果 现 在 把 这 笔 钱 存 入 银行 , 在 一 定期 间 结 
束 时 ,银行 存款 的 余额 与 那 时 可 得 到 的 金额 相等 。 


定义 ”给 定 贴现 因子 3$, 无 限 的 收益 序列 ri rz, xsa*… 的 现 值 为 


xit önt R+S sort 
fa 


借助 于 贴现 因子 3, 还 可 以 把 我 们 称 之 为 无 限 重 复 的 博弈 解释 为 一 个 
有 限 重复 的 博弈, 但 在 其 结束 之 前 重复 进行 的 次 数 是 随机 的 ,设想 在 博弈 的 
每 一 阶段 完成 后 ,都 要 掷 一 枚 (加 权 的 ) 大 币 来 决定 博 完 是否 结 束 。 如 果 博 
弈 立刻 结束 的 概率 为 p, 则 博弈 将 至 少 再 进行 一 个 阶 眉 的 概率 为 1 p, TE 
下 一 阶 自 将 可 以 得 到 的 收益 {如果 能 继续 进行 )x, 在 当前 阶段 的 硬币 未 括 
之 前 的 价值 只 有 (1 一 pp)r/A(1+ x)。 与 之 相似 ,在 两 个 阶段 之 后 可 能 得 到 的 
a tai ee ed aed yi 
MARAU- pPefUtr?s, Se=(1- pV tr), WRI r + 6x2+ 

mst Rue ane 又 包含 了 博弈 将 要 结束 的 可 能 性 。 

下 面 我 们 分 析 无 限 重复 的 囚徒 困境 博弈 , 其 中 每 一 参与 者 的 贴现 因子 
都 为 5, 且 每 一 参与 者 在 重复 博弈 中 得 到 的 收益 等 于 各 自在 所 有 阶段 博 蛮 
中 得 到 收益 的 现 值 。 我 们 将 证 明 尽 管 阶段 博弈 中 惟一 的 纳什 均衡 是 不 合 
作 一 一 即 ( 工 :, 工 2) 可 在 无 限 重 复 博弈 的 一 个 子 博 蛮 精 烽 解 中 , 每 一 阶 

结果 都 将 是 祖 互 合作 一 一 即 (Ri, R2)。 论 证 中 要 运用 我 们 分 析 基 于 图 
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2.3.3 的 两 阶段 重复 博弈 时 的 思想 (在 该 阶 眉 博弈 中 我 们 在 囚徒 困境 的 基 
础 上 加 入 了 第 二 个 纳什 均衡 ) :如 果 目 前 参与 者 相互 合作 , 则 下 一 阶段 他 们 
将 选择 高 收益 的 均衡 结果 , 否则 将 选择 低 收益 的 均衡 结果 。 两 阶段 重 复 捕 
弈 和 无 限 重 复 博弈 的 不 同 之 处 在 于 ,这 里 下 一 次 可 选择 的 高 收益 均衡 , 并 不 
是 人 为 加 在 阶段 博弈 之 上 的 另 一 个 均衡 结果 ,而 是 代表 着 在 下 一 院 段 及 其 
后 的 继续 合作 。 

假设 参与 者 ; 在 无 限 重 复 博 蛮 的 开始 选择 相互 合作 的 战略 ,并且 当 且 
仅 当 前 面 每 个 阶段 参与 双方 都 选择 相互 合作 时 , 在 其 后 的 阶段 博弈 中 也 选 
择 相 互 合作 。 我 们 可 把 参与 者 i 的 这 一 战略 正式 表述 为 : 

在 第 一 阶段 选择 Ro HEW : 阶段 ,如 果 所 有 前 面 上 - 1 阶段 的 结果 
都 是 (Ri, R2), 则 选择 R, 否则 选择 Lio 

这 一 战略 是 触发 战略 (trigger strategy) 的 一 种 ,之 所 以 称 为 触发 战略 ， 
是 因为 如 果 没 有 人 选择 不 合作 , 合作 将 一 直 进行 下 去 ; 一旦 有 人 选择 不 合 
作 , 就 会 触发 其 后 所 有 阶段 都 不 再 相互 合作 。 如 果 参 与 双方 都 采取 这 种 触 
发 战略 , 则 此 无 限 重复 博弈 的 结果 就 将 是 每 一 阶段 选择 (Ri, Rz)。 我 们 首 
先 论证 如 果 5 距 1 足够 近 , 则 采取 这 种 战略 , 对 参与 双方 都 是 无 限 重复 博 
弈 的 纳什 均衡 , 其 后 青 证 明 这 一 纳什 均衡 是 子 博 弈 精炼 的 , 以 使 论证 更 为 严 
格 。 

为 证 明 采 取 上 述 触发 战略 , 对 参与 双方 来 讲 都 是 无 限 重 复 博 弈 的 纳什 
均衡 ,我 们 将 假定 参与 者 i 已 采取 触发 战略 , 并 证 明 在 3 与 1 足够 接近 的 条 
件 下 ,参与 者 j 的 最 优 反 应 为 也 选择 同样 的 战略 。 由 于 一 旦 某 阶 段 的 结果 
WHT CR, R), 参与 者 i 将 在 其 后 永远 选择 Li, 那么 如 果 某 阶段 的 结果 偏 
BTR, Ra), BSF j 的 最 优 反 应 同样 是 在 其 后 永远 选择 L;。 余 下 的 就 
是 计算 参与 者 j 在 第 一 阶段 的 最 优 反应 ,以 及 前 面 的 结果 都 是 (Ri, Rt, 
下 一 阶段 的 最 优 反 上 应。 选择 工 ; 将 会 使 当期 得 到 5 的 收益 , 但 却 会 触发 参与 
者 i 的 永远 不 合作 战略 (从 而 亦 引 发 参与 者 j 本 人 的 不 合作 ), 于 是 未 来 每 
一 阶段 的 收益 都 将 成 为 1。 由 于 1+8+8*+…=1/(1 一 26), 上 述 一 系列 收 
益 的 现 值 为 


5+61+821+…=5+T2 

采取 另外 的 战略 ,选择 R; 在 本 期 的 收益 将 为 4, 并且 在 下 一 阶段 还 可 得 到 
完全 相同 的 选择 机 会 , 令 V 表示 参与 者 ; 在 (当前 和 以 后 每 一 次 面临 同样 
选择 时 ) 无 限 次 的 选择 中 总 选择 最 优 战 略 时 收益 的 现 值 。 如 果 选 择 Ri 是 
最 优 的 , 则 
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Vedterv ， 
或 V=4/(1 ~ 5), 因 为 选择 RR 时 ,下 一 阶段 还 有 机 会 进行 相同 选择 。 如 果 
选择 L; 是 最 优 的 , 则 


=54—2 
V=5+T > ， 


此 结果 前 面 已 经 导出 。 于 是 , 当 且 仅 当 下 式 成 立 ,选择 R, 为 最 优 : 


4 Š 
454-2 
1 75 1-8’ (2.3.1) 


B SSi. FR MALY 8 之 1/4 时 , ERO, 并且 在 前 面 结果 都 是 
(Ry, R2) 的 下 一 阶段 ,参与 者 ; 的 最 优 反 应 (给 定 参 与 者 i 已 采取 了 触发 战 
咯 ) 为 Rj。 这 一 结论 , 再 加 上 前 面 已 证 明 的 , 一 旦 某 一 阶段 的 结果 偏离 了 
(Ry, R2),j 的 最 优 反 应 就 是 永远 选择 L;, 我 们 已 经 证 明 当 和 且 仅 当 OS 1/4 
时 , 参与 双方 都 采取 触发 战略 是 博弈 的 纳什 均衡 。 

下 面 我 们 要 论证 的 是 这 一 纳什 均衡 同时 又 是 子 博弈 精炼 的 。 为 做 到 这 
一 点 ,首先 定义 重复 博弈 中 的 以 下 三 个 概念: 重复 博弈 中 的 战略 、 重 复 博弈 
的 子 博弈 以 及 重复 博弈 的 子 博弈 精炼 纳什 均衡 。 为 借助 前 一 节 中 的 简单 例 
子 说 明 这 些 概念 ,我 们 将 对 有 限 重复 博弈 和 无 限 重 复 博 弈 中 的 情况 同时 给 
出 定义 。 在 上 一 节 , 我 们 基于 阶段 博弈 G= 14 e, Anst to 定义 了 
有 限 重复 博弈 G(T) 其 中 的 G 是 一 个 完全 信息 静态 博弈 ,参与 者 1 到 
同时 从 各 自 的 行动 空间 A 到 A, 中 分 别 选 择 行动 a1 到 an 得 到 收益 a, 
(ai au) 到 unlar as) 现在 我 们 定义 类 似 的 无 限 重 复 博弈 .中 


定义 ”给 定 一 个 阶段 博弈 G, 令 G(m, 5) 表示 相 应 的 无 限 重 复 博弈， 
其 中 G 将 无 限 次 地 重复 进行 , 且 和 参与 者 的 贴现 因子 都 为 9。 对 每 一 个 1, 之 
前 :一 1 次 阶段 博 讲 的 结果 在 : 阶段 开始 进行 前 都 可 被 观测 到 , 每 个 参与 者 
在 G(Cco ,6) 中 的 收益 都 是 该 参与 者 在 无 限 次 的 阶段 博弈 中 所 得 收益 的 现 
值 。 


在 所 有 博弈 (无 论 是 重复 的 还 是 非 重复 的 ) 中 ,参与 者 的 一 个 战略 都 是 
行动 的 一 个 完整 计划 一 一 它 包括 了 该 参与 者 在 所 有 可 能 的 情况 下 , 需要 作 
出 选择 时 的 行动 。 更 形象 一 点 讲 , 如果 一 个 参与 者 在 博弈 开始 前 把 一 个 战 


O 我 们 当然 也 可 以 基于 一 个 动态 阶段 博弈 定义 一 个 重复 博 论 , 本 节 我 们 将 讨论 限于 葛 态 的 
阶 侦 博 弈 是 为 了 尽 可 弦 简 单 地 说 明 主要 原理 。 在 第 2-3.D 和 第 2.3.E 节 的 应 用 中 就 有 基于 动态 
阶段 博弈 的 重复 博弈 。 
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Wey BR SS HAY RI, AEE RE OY UC ee OS, 在 任何 情况 下 都 无 需 
再 征询 参与 者 的 意见 。( 指 客观 上 不 需要 , 即 各 种 情况 下 应 该 怎么 办 已 由 参 
与 者 的 战略 安排 好 了 , 而 不 是 指 律师 可 以 代理 决策 译注 ) 例 如 一 一 在 一 
个 完全 信息 静态 博弈 中 , 一 个 战略 就 是 一 个 简单 的 行动 (这 也 是 为 什么 我 们 
在 第 1 章 中 将 这 样 的 博弈 表示 为 G = | S1,…, Sp w1,…, uni, 而 在 本 章 又 
表示 为 GJA Anun tn| :对 一 个 完全 信息 静态 博弈 而 言 ,参与 者 ; 
的 战略 空间 S; 即 简单 等 于 其 行动 空间 A,)。 不 过 在 动态 博弈 中 ,一 个 战略 
就 较为 复杂 了 。 

考虑 前 一 节 分 析 的 两 阶段 下 徒 困境 , 每 一 个 参与 者 都 有 两 次 行动 ,于 是 
也 许 有 人 会 认为 一 个 战略 就 是 一 对 指令 (5,c), 其 中 6 是 第 一 阶段 的 行动 ， 
< 是 第 二 阶段 的 行动 。 但 第 一 阶段 有 四 个 可 能 的 结果 一 一 (1, Le), (Li, 
R2), (Ry La) BCR, Rs) 一 一 它们 民 表 了 四 种 不 同 的 情况 ,每 一 参与 者 都 
可 能 针对 这 些 情况 作出 不 同 的 反应 。 从 而 ,每 一 参与 者 的 战略 就 应 包含 5 
条 指令 , BRAC, w, rz,y,*)。 这 里 v 为 第 一 阶段 的 行动 , w,x,y 及 z 
则 表示 针对 第 一 阶段 的 不 同 结果 (Li, L2), (Lo R2), (Ri, La) BCR), 
RR2), 分 别 应 该 在 第 二 阶段 采取 的 行动 。 使 用 这 一 表示 ,“ 第 一 阶段 选择 5， 
且 不 论 第 一 阶段 出 现 什么 结果 , 均 在 第 二 阶段 选择 "这 一 指示 就 可 写成 
(b,c, c, cc), 但 这 一 表示 方法 也 可 以 表示 第 二 阶段 行动 依赖 于 第 一 阶段 
结果 的 战略 , 比如 (b, cy c,c,5), 它 的 舍 义 是 “第 一 阶段 选择 5, 如果 第 一 阶 
县 的 结果 是 (Ri, Ro), 则 在 第 二 阶段 选择 b, 否则 第 二 阶段 选择 ce”。 类 似 
地 ,在 基于 图 2.3.3 的 两 阶段 重复 博弈 中 , 每 一 参与 者 的 战略 都 包含 10 条 
指令 一 个 第 一 阶段 的 行动 和 9 个 不 同情 况 下 的 第 二 阶段 的 行动 , 针对 
第 一 阶段 每 一 个 可 能 的 结果 都 有 相应 的 行动 。 请 回顾 在 对 此 两 阶段 重复 博 
弈 进行 分 析 时 , 我 们 曾 考 虑 过 的 一 个 战略 , 其 中 参与 者 第 二 阶段 的 行动 是 依 
第 一 阶段 结果 而 确定 的 ;第 一 阶段 选择 M,, 如 果 第 一 阶段 的 结果 是 (M1， 
M2), 则 在 第 二 阶段 选择 R, 如 不 是 , 则 选择 L;。 

EAR BRM G(T RAR ARE Go, SP, WFR ME z 的 
进行 过 程 (history of play through stage z ) 指 各 方 参与 者 从 阶段 1 到 阶段 : 
所 有 行动 的 记录 。 例 如 ,参与 者 可 能 在 第 一 阶段 选择 (an,…, ay), 在 第 二 
阶段 选择 (a4。,…,a,s)…, 在 第 : 阶段 选择 (a1,,…,aw), 其 中 对 每 一 参与 
者 i, 在 阶段 ; 的 行动 a 属于 行动 集 A,。 


定义 ”在 有 限 重 复 博 弈 G( 芽 ) 或 无 限 重复 博弈 G(c ,3) 中 , 参与 者 的 
一 个 战略 特 指 在 每 一 阶段 ,针对 其 前 面 阶段 所 有 可 能 的 进行 过 程 ,参与 者 将 
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会 选择 的 行动 。 


下 面 我 们 讨论 子 博 弈 。 一 个 子 博 弈 是 全 部 博弈 的 一 部 分 , 当 全 部 博 蛮 
进行 到 和 任何 一 个 阶段 , 到 此 为 止 的 进行 过 程 已 成 为 参与 各 方 的 共同 知 
识 , 而 其 后 尚未 开始 进行 的 部 分 就 是 一 个 子 博弈 (在 本 节 后 面 的 部 分 我 
们 将 给 出 重复 博弈 G(T) 和 Gtc ,53) 的 子 博弈 的 精确 定义 , 在 第 
2.4.B 节 还 将 针对 一 般 的 完全 信息 动态 博弈 给 出 子 博弈 的 精确 概念 )。 
例如 在 两 阶段 囚徒 困境 中 ,就 有 4 个 子 博弈 ,分 别 为 第 一 阶段 4 种 可 能 
的 结果 出 现 后 , 第 二 阶段 的 博弈 。 类 似 地 , 在 基于 图 2.3.3 的 两 阶段 博 
弈 中 ,存在 9 个 子 博弈 ,因为 在 第 二 阶段 开始 前 , 第 一 阶段 的 博弈 可 能 会 
出 现 9 个 不 同 的 结果 ,而 每 种 结果 出 现 后 , 第 二 阶段 的 博弈 都 是 一 个 不 
同 的 子 博 穿 。 在 有 限 重 复 博 弈 CCTIMARER RH G(o ,3) 中 ， 
战略 的 定义 和 子 博 弈 的 定义 关系 非 常 密切 :参与 者 的 一 个 战略 指 该 参与 
者 在 博弈 的 第 一 阶段 选择 的 行动 以 及 在 其 所 有 子 博弈 的 第 一 阶段 将 要 
选择 的 行动 。 


定义 ”在 有 限 重复 博弈 G(T) 中 , 由 第 :+ ! 阶段 开始 的 一 个 子 博弈 为 
G 进行 -< 次 的 重复 博弈 , 可 表示 为 GCT 一 臣 。 由 第 :+1 阶 段 开始 有 
许多 子 博 弈 ,到 * 阶段 为 止 的 每 一 可 能 的 进行 过 程 之 后 都 是 不 同 的 子 博弈。 
在 无 限 重 复 博 弈 G(%, 引 ) 中 ,由 + + 1 阶段 开始 的 每 个 子 博弈 都 等 同 于 初 
始 博弈 GC% ,6), 和 在 有 限 情况 下 相似 , 博弈 G, A e 阶段 为 止 有 多 
少 不 同 的 可 能 进行 过 程 ,就 有 多 少 从 z +1 阶段 开始 的 子 博弈 。 


有 一 点 务 请 注意 , 重复 博弈 的 第 上 阶段 本 身 ( 在 有 限 情况 下 假定 < 
了 T) 并 不 是 整个 博弈 的 一 个 子 博弈 。 子 博弈 是 原 博 弈 的 一 部 分 ,不 只 是 说 博 
弈 到 此 为 止 的 进行 过 程 已 成 为 全 居 参 与 者 的 共同 知识 ,还 包括 了 原 博弈 在 
这 一 点 之 后 的 所 有 进行 。 只 单独 分 析 第 : 阶段 的 博弈 就 等 于 把 第 # 阶段 看 
成 原 恒 复 博 赛 的 最 后 一 个 阶段 , 这 样 的 分 析 也 可 能 会 得 到 一 些 结论 ,但 却 完 
全 无 助 于 对 整个 重复 博弈 的 分 析 。 

现在 我 们 可 以 给 出 子 博弈 精炼 纳什 均衡 的 定义 了 , OS a 
衡 的 概念 之 上 。 后 者 和 第 1 章 中 的 定义 并 无 二 致 ,但 这 里 包含 了 在 动态 博 
弈 中 参与 者 战略 的 潜在 复杂 性 :在 所 有 博弈 中 , 纳什 均衡 是 所 有 参与 者 的 一 
个 战略 组 合 ,每 个 参与 者 者 有 一 个 战略 , 并且 每 一 参与 者 的 战略 都 是 针对 其 
他 参与 者 战略 的 最 优 反应 。 
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ESLER (Sehen, 1965)) 如 果 参 与 者 的 战略 在 每 一 子 博 蛮 中 都 构 
成 纳什 均衡 , 我 们 则 说 纳什 均衡 是 子 朝 弈 精 头 的 。 


子 博弈 精炼 纳什 均衡 把 纳什 均衡 的 概念 进一步 严格 化 , 即 一 个 子 博弈 
精炼 均衡 首先 必须 是 纳什 均衡 , 然后 还 须 通过 其 他 检验 。 

为 证 明 无 限 重复 因 徒 困境 中 的 击 发 战略 纳什 均衡 是 子 博 弈 精炼 的 , 我 
们 必须 证 明 触发 战略 在 此 无 限 重 复 博弈 中 的 每 一 子 博 弈 中 都 构成 了 纳什 均 
窒 。 我 们 已 提 到 , 无 限 重 复 博 弈 的 每 一 子 博弈 都 等 同 于 炭 博 弈 。 在 无 限 生 
复 因 徒 困境 的 触发 战略 纳什 均衡 中 , 这 些 子 博 弈 可 分 为 两 类 :{ 芭 所 有 以 前 
阶段 的 结果 都 是 (Ri Rs) 的 子 搏弈, 和 (ii) 至 少 有 一 个 前 面 阶段 的 结果 不 是 
CRU Ra) 的 子 博弈 。 如 果 参 与 者 在 整个 博弈 中 采取 触发 战略 , 则 (i 参 与 者 
在 第 一 类 子 博弈 中 的 战略 同样 是 触发 战略 , 我 们 已 证 明 它 是 整个 博弈 的 一 
个 纳什 均衡 ;(i) 参 与 者 在 第 二 类 子 博 弈 中 的 战略 只 是 永远 单纯 重复 阶段 博 
BEIGE (Ly, 1L2), 它 同样 是 整体 博弈 的 纳什 均衡 。 从 而 可 以 证 明 , 无 限 重 
复 四 徒 困境 中 的 触发 战略 纳什 均衡 是 子 博弈 精炼 的 。 


大 与 者 2 的 收益 


0,5) (4.4) 


大 与 者 1 的 收益 
6,0) 


2.3.7 


下 面 我 们 将 相似 的 论 诈 用 于 无 限 重复 博弈 G(c ,3)。 这 些 论证 将 导 
出 弗 里 德 曼 (1971) 的 无 限 重 复 博 弈 定理 。 为 表述 这 一 定理 , RNR 
定义 两 个 概念 。 第 一 ,我 们 称 一 组 收益 (xi,…, zx,) 为 阶段 博弈 G 的 可 行 
收益 (feasible), MRE MLE G 的 纯 战 略 收益 的 凸 组 售 (convex combination) 
{ 即 纯 战略 收益 的 邵 权 平均 ,权重 非 负 上 且 和 为 1), 图 2.3.6 所 示 因 徒 困境 的 
可 行 收益 集合 为 图 2.3.7 中 的 阴影 区 域 。 纯 战略 (1,1), (0,5),(4, 4) 和 (5， 
0) 都 是 可 行 的 , 其 他 可 行 收益 包括 1<xz<<4 的 所 有 (x, 三 ), 它们 由 (1,1) 与 
《4,4) 的 加 权 平 均 得 出 ,以 及 满足 y+ z=5 明 0<y<5 的 所 有 (y,z), 它 们 
由 (0,.5) 与 (5,0) 加 权 平 均 得 出 。 图 2.3.7 阴影 区 域 之 内 的 其 他 组 合 是 由 两 
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个 以 上 的 纯 战 略 收益 加 权 平 均 得 出 的 。 为 达到 纯 战 略 收益 的 加 权 平 均 收 
益 , 参 与 者 可 以 使 用 一 个 共同 的 随机 数 发 生 器 :例如 ,根据 据 一 枚 (均匀) 硬 
重 的 结果 选择 (Li, Ro) BCR, La). 他们 可 以 得 到 的 期 望 收益 为 (2.5， 
2.5)。 

为 表述 弗 里 德 曼 定理 , 我 们 需要 的 第 二 个 概念 用 以 重新 衡量 参与 者 的 
收益 。 我 们 仍 将 每 一 参与 者 在 无 限 重 复 博 弈 G(co, 3) 的 收益 定义 为 该 参 
与 者 在 无 限 个 阶段 博弈 中 收益 的 现 值 ,但 我 们 用 同样 无 限 个 收益 值 的 主 均 
收益 (average payoff) 来 圾 示 这 一 现 值 却 更 为 方便 , 平均 收益 指 为 得 到 相等 
的 收益 现 值 而 在 每 一 阶段 都 应 该 得 到 的 等 额 收益 值 。 令 贴现 因子 为 8, 设 
无 限 的 收益 序列 m, m, ms,… 的 现 值 为 Y, 如 果 每 一 阶段 都 能 得 到 的 收益 为 
x, 则 现 值 为 x/(1 一 86)。 在 贴现 因子 为 时 5, 为 使 x FERF A r,r ns， 
… 的 平均 收益 , 这 两 个 现 值 必须 相等 ,于 是 <= V(t 一 $8), 也 就 是 说 ,平均 收 
益 为 现 值 的 (1 8) 倍 。 


定义 ”给 定 贴现 因子 ô, 无限 的 收益 序列 mi, wp, xs,… 的 平均 收益 为 
a- ade, s 


HREM HE, AFER EA EE es Ae E BEREA Goe eB, 
Bo AM, ER 2.3.6 的 囚徒 图 境 中 ,两 参与 者 在 每 一 阶段 都 可 得 到 4 的 收 
益 , 这样 一 个 元 限 的 收益 序列 的 平均 收益 为 4, 但 现 值 为 4(1 一 6)。 不 过 ， 
由 于 平均 收益 只 是 现 值 的 另 一 种 衡量 , 使 平均 收益 最 大 化 即 等 同 于 使 现 值 
最 大 化 。 

现在 , 我们 终于 可 以 给 出 对 无 限 重复 博弈 进行 讨论 的 主要 结果 了 : 


定理 ( 弗 里 德 曼 , 1971) $ G 为 一 个 有 限 的 完全 信息 静态 博弈 , S 
{en se BR G 的 一 个 纳 秆 均衡 下 的 收益 , 且 (xz1,…, 工 ,) 表 示 G 的 其 
他 任何 可 行 收益 。 如 果 对 每 一 个 参与 者 i 有 xz;> ei, BWR 5 足够 接近 于 
1, 则 无 限 重复 博弈 Go, 5) 存 在 一 个 子 博弈 精炼 纳什 均衡 , 其 平均 收益 可 
ER e, En)o 
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致 ,我 们 将 其 放 在 附录 2.3.B。 把 这 一 定理 的 结果 扩展 到 一 般 的 既 非 有 限 ， 
亦 非 静态 的 阶段 铺 弈 , 从 概念 上 讲 毫 无 障碍 , 但 用 符号 表示 却 显 得 有 些 杂 


P2 完全 入 和 让 动态 精 区 77 


企业 1 的 收益 


(5,0) 


2.3.8 


al, Ae AF SSL 3 Tb. ÆA 2.3.6 的 内 徒 困境 中 , OB 
BOS SHRET E 2.3.8+- FRA LHR BR UM Re ee 
的 一 个 子 博弈 精炼 纳什 均衡 下 的 平均 收益 , 其 前 提 是 贴现 因子 距 1 足够 接 
近 。 

在 本 节 最 后 ,我 们 简单 介绍 无 限 重复 博弈 理论 的 两 个 进一步 发 展 , 这 两 
方面 都 由 于 囚徒 困境 的 特殊 性 而 被 撩 盖 了 。 在 图 2.3.6 的 (一 次 性 ?四 徒 困 
境 中 ,参与 者 宇通 过 选择 志 i, 可 保证 至 少 得 到 纳什 均衡 收益 ft, 但 是 在 一 次 
性 的 古 诺 双 头 博弈 { 像 第 1.2.A 节 中 描述 的 那样 ) 中 , 一 个 企业 通过 生产 纳 
什 均衡 产 出 , 并 不 能 保证 得 到 纳什 均衡 下 的 利润 ;而 一 个 企业 所 能 保证 得 到 
的 惟一 的 利润 为 0, 这 时 它 可 以 完全 停工 。 给 定 一 个 任意 的 阶段 博弈 G, 令 
r; 表示 参与 者 i 的 保留 收益 {reservation payoff) 无 论 其 他 参与 者 如 何 
行动 ,参与 者 主 能 够 保证 的 最 大 收益 。 则 一 定 会 有 Se GH e; 为 弗 里 德 
曼 定 理 中 使 用 的 纳什 均衡 下 的 收益 ), 因为 如 果 x; 大 于 e:, 则 参与 者 再 选择 
其 纳什 均衡 战略 就 不 是 他 的 最 优 反 应 。 在 囚徒 困境 中 , r= e, BETEN 
头 博弈 (此 类 居多 ) 中 , ri <eo 

富 登 伯 格 和 马 斯 金 (1986) 证 明 对 两 个 参与 者 的 博 穿 , 弗 里 德 曼 定理 中 
的 均衡 收益 (eli, ez) 换 为 保留 收益 (ri, ra), 结论 同样 成 立 。 即 如 果 ( xz1, x2) 
为 G 的 一 个 可 行 收益 , 且 对 每 个 i 都 有 =; > ri， 则 对 足够 接近 于 A 3, G 
《co,3) 存 在 一 个 子 博弈 精炼 纳什 均衡 ,其 平均 收益 等 于 (zt a), 即使 对 某 
个 或 双方 参与 者 来 说 , x; < ei。 对 参与 者 为 两 方 以 上 的 博弈 , 富 登 伯 格 和 马 
斯 金 给 出 了 一 个 较 宽 松 的 条 件 ,使 得 定理 中 的 均衡 收益 (el …, ev ) 可 以 赫 
换 为 保留 收益 (rrn)。 
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一 个 互补 性 的 问题 同样 有 趣 : 在 贴现 因子 并 不 “足够 接近 于 1” 时 ,于 博 
弈 精 震 纳什 均衡 能 达到 什么 样 的 平均 收益 ?处理 这 一 问题 的 思路 之 一 是 令 
5 等 于 一 个 固定 值 ,并 在 很 设 参与 者 运用 触发 战略 ,一旦 发 生 任何 偏离 就 永 
远 转 到 阶段 博弈 的 纳什 均衡 的 条 件 下 , 计算 可 以 达到 的 平均 收益 。 在 决定 
当前 阶段 是 否 偏离 时 , 8 越 小 ,下 一 阶段 开始 进行 悉 罚 的 效果 就 越 小 。 
然而 , 一 般 来 讲 参与 者 总 可 以 比 简单 重复 阶段 博弈 的 纳什 均衡 得 到 更 高 
的 收益 。 第 二 种 方法 , 由 阿布 勒 (Abreu, 1988) 最 先 提 出 , 它 基 于 如 下 思 
路 , 即 阻 止 一 个 参与 者 偏离 既定 战略 的 最 有 效 的 方法 是 威胁 该 参与 者 ， 
一 旦 偏离 ,就 将 受到 最 严厉 的 可 信 的 息 罚 ( 即 威胁 该 参与 者 , 一 旦 偏离 ， 
就 将 选择 使 偏离 者 收益 最 低 的 无 限 重复 博弈 的 子 博 弈 精炼 纳什 均衡 ) 。 
在 绝 大 多 数 博 弈 中 , 永远 转 到 阶段 博 蛮 的 纳什 均衡 并 不 是 最 严厉 的 可 信 
惩罚 ,于 是 有 些 使 用 触发 战略 方法 无 法 达到 的 平均 收益 , 运用 阿布 勒 的 
方法 可 以 达到 。 不 过 , 在 因 徒 困境 中 , 阶段 博弈 的 纳什 均衡 欠 好 得 到 保 
留 收益 { 即 e; = ri), 则 这 两 种 方法 是 等 价 的 。 下 一 节 将 对 这 两 种 方法 分 
别 给 出 相应 的 例子 。 


AE 2.3.B 
本 附录 证 明 弗 里 德 曼 的 定理 。 令 (ac,…, a ) 为 G 的 纳什 均衡 ,均衡 
WERE A Cerys es)。 类 似 地 , Glar r aen ) 为 带 来 可 行 收益 ( 工 )，…, ay) 


的 行动 组 合 。( 后 面 的 符号 只 是 象征 性 的 , 因为 它 忽 略 了 要 达到 任意 可 行 收 
益 一 般 都 需要 借助 于 公用 的 随机 数 发 生 器 ) 考 虑 以 下 参与 者 i 的 触发 战略 ; 

在 第 一 阶段 选择 auo ER * 阶段 , 如 果 所 有 前 面 + -1 个 阶段 的 结果 
都 是 (art, am), WER sz; 否则 选择 os 。 

如 果 参 与 双方 都 采用 这 种 钥 发 战略 , 则 无 限 重复 博弈 的 每 一 阶段 的 结 
果 都 将 是 (ax1,…, a ), 从 而 (期 组 的 ) 收 益 为 (z1,…, ze)。 首 先 ,我 们 论证 
WR 8 足够 接近 于 1, 则 参与 者 的 这 种 战略 是 重复 博弈 的 纳什 均衡 , 其 后 再 
证 明 这 样 一 个 纳什 均衡 是 子 博弈 精炼 的 。 

设想 除 参 与 者 i 之 外 的 所 有 参与 者 都 采用 了 这 一 触发 战略 。 由 于 一 旦 
某 一 阶段 的 结果 不 是 (asi,…, am) 其 他 参与 者 将 永远 选择 (ac va,i-i 
Geir em) 参与 者 宇 的 最 优 反应 为 一 旦 某 一 阶段 的 结果 偏离 了 (as 
ram) RKT ae。 其 余 就 是 要 确定 参与 者 i 在 第 一 阶段 的 最 优 反 
应 , 以 及 之 前 所 有 阶段 的 结果 都 是 (esi …, ae ) 时 的 最 优 反 应 。 令 ax 为 参 
与 者 i 对 (au …,em) 的 最 优 偏离 , 即 au 为 下 式 的 解 


max u; (azis r,i -1> ais sit rn) o 
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S di 为 i 从 此 偏离 中 得 到 的 收益 : d = u; lart ,axils Rais Gritt > 
amj 史 再 一 次 我 们 忽略 了 随机 数 发 生 器 的 作用 :最 优 偏 离 及 其 收益 可 以 依赖 
于 随机 数 发 生 器 产生 的 纯 战 略 )。 我 们 有 diar; = ular s ar, i- Gas 
aait s Om) DEE Uday r am) o 

选择 au 将 会 使 当前 阶段 的 收益 为 di, 但 却 将 触发 其 他 参与 人 永远 选择 
Cares Beit) Ge ities Gen 对 比 参 与 者 i 的 最 优选 择 为 as, 于 是 未 来 
每 一 阶段 的 收益 都 将 是 e。 这 一 收益 序列 的 现 值 为 


dit d+e,4 Bete = d; irisa 
(由 于 任何 偏离 都 将 触发 其 他 参与 者 的 相同 反应 , 我 们 只 需 考 虑 能 带 来 最 大 
收益 的 偏离 就 足够 了 )。 另 一 方面 ,选择 ex 将 在 本 阶段 得 到 收益 ri, 并且 在 
下 一 阶段 可 在 ass 和 au= 之 间 进 行 完 全 相同 的 选择 。 令 V 表示 参与 者 i 就 
此 作出 最 优选 择 时 各 阶段 博弈 收益 的 现 值 (目前 及 其 后 每 一 次 面临 这 样 选 
择 时 ) 。 如 果 选 择 a 是 最 优 的 , 则 

Vi=r+ov 或 Vi,=2,/(1-8) 
如 果 选 择 as 是 最 优 的 , 则 


V= =d,+725 pa > 


此 式 前 面 已 经 导出 (假定 随机 数 发 生 器 序列 不 相关 (serially uncorrelated), 
则 令 d 为 参与 者 i 偏离 随机 数 发 生 器 确定 的 不 同 纯 战 略 可 能 得 到 的 最 高 
BERET) BA, 当 且 仅 当 下 式 成 立 选 择 <= 是 最 优 的 
Daatje 或 sag 

从 而 ,在 第 一 阶段 ,并 且 在 之 前 的 结果 都 是 (as1,…, a ) 的 任何 阶段 , 当 上 且 
仅 当 824, 一 zj)/(di 一 ei) 时 ,参与 者 i 的 最 优 行动 (给 定 其 他 参与 者 已 采 
用 了 触发 战略 ) 是 as 

给 定 这 一 结果 以 及 一 旦 某 一 阶 眉 的 结果 偏离 了 (as,-…, am), Wi Y 
最 优 反 应 是 永远 选择 au, 我 们 得 到 当 且 仅 当 下 式 成 立时 , 所 有 参与 者 采用 
开始 时 描述 的 触发 战略 是 纳什 均 衔 


d; 
9 之 max a. 


EET 


由 于 dia, > ei, 对 每 一 个 1 都 一 定 有 (di - 2d, -ei)<1, 那 么 对 所 有 
参与 者 上 式 的 最 大 值 也 一 定 严格 小 于 1。 
. 余下 的 就 是 证 明 这 一 纳什 均衡 是 子 博弈 精炼 的 , 即 触 发 战略 必须 在 G 
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(%m,6) 的 每 一 个 子 博弈 中 构成 纳什 均衡 。 我 们 已 讲 过 , G, 8) 的 每 一 个 
子 博弈 都 等 同 于 G( oo,3) 本 身 。 在 触发 战略 纳什 均衡 中 , 这 些 子 博弈 可 分 
为 两 类 :(i) 所 有 前 面 阶段 的 结果 都 是 (exi,…, am) 时 的 子 博 蛮 ; 和 (ii) 前 面 
至 少 有 一 个 阶段 的 结果 偏离 了 (as1,…,am ) 时 的 子 博 弈 。 如 果 参 与 者 在 整 
个 博弈 中 采用 了 触发 战略 , 则 (i) 参 与 者 在 第 一 类 子 博弈 中 的 战略 语 样 也 是 
触发 战略 , 而 我 们 刚刚 证 明 它 是 整个 博弈 的 纳什 均衡 ;(i 参 与 者 在 第 二 类 
子 博 弈 中 的 战略 永远 是 简单 重复 阶 发 博弈 均衡 (ac …,am), 它 也 是 整个 
博 讲 的 一 个 纳什 均衡 。 闪 而 ,我 们 证 明了 无 限 重 复 博弈 的 触发 战略 纳什 均 
DFE FASE AEBS. 


2.3.C EEMALE FI 


BMS 971) AHEM, ERRER ER T, RMR, 只 要 发 
EEREN, 就 在 以 后 阶段 永远 转 到 阶段 博弈 的 纳什 均衡 ,由 此 可 以 达成 在 
整个 博 诫 中 的 合作 。 最 初 使 用 的 例子 是 古 诺 双 头 垄 断 时 的 共 谋 ,介绍 如 下 。 

首先 回顾 第 1.2.A 节 讲 过 的 静态 古 诺 博弈 :如 果 市 场 中 的 总 产量 为 Q 
= gq1+ oo, 则 市 场 出 清 价格 为 P(Q)=a-Q, 假 定 Q@Q<a。 每 一 企业 的 边 
际 成 本 为 c, 且 无 固定 成 本 , 两 企业 同时 选择 产量 。 在 唯一 的 纳什 均衡 条 件 
下 ,每 一 企业 的 产量 为 (a - c)/3, 我 们 称 之 为 十 诺 产量 并 用 g。 表示 。 由 于 
均衡 条 件 下 的 总 产量 2(a - c)/3 大 于 垄断 产量 gp = (a - c)/2, MERE 
业 分 别 生 产 芍 断 产 出 的 一 半 , 即 gs = sen/2 时 , 每 一 企业 的 福利 都 将 较 均 衡 
情况 下 提高 。 

考 虚 以 上 述 吉 诺 博 蛮 为 阶段 博 蛮 的 无 限 重复 博弈 ,两 企业 的 贴现 因子 
均 为 3。 下 面 我 们 计算 两 个 企业 的 下 述 触发 战略 成 为 无 限 重复 溥 弈 的 纳什 
均衡 时 ,贴现 因子 3 的 值 : 

在 第 一 阶段 生产 垄断 产量 的 一 半 , gw/2。 第 : RR. RA t- 

IT 个 阶段 两 个 企业 的 产量 都 为 9,/2, WEF gw /2; 否则 , 生产 古 诺 产 

Bae 
贝 于 在 前 一 节 的 囚徒 困境 中 已 进行 过 相似 的 证 明 , 这 里 我 们 只 给 出 论证 过 
程 的 要 点 。 

当 双 方 都 生产 gm/2 时 ,每 个 企业 的 利润 为 (a 一 c)?/8, 我 们 用 x/2 Æ 
表示 。 当 双方 都 生产 g 时 ,每 个 企业 的 利润 为 (a - c)?/9, 我 们 x 用 表示 。 
最 后 ,如果 企 业 主将 在 本 期 生产 g,,/2, 则 使 企业 ; 本 期 利润 最 大 化 的 产量 

是 下 式 的 解 
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matacgs i; =e)g 
a T D Im i 


CHI 9; =3(a - c)/8, 相应 的 利润 水 平 为 9(a - c)?/64, RINA ra 表 
示 (d 表示 偏离 )。 那 么 , 要 使 两 企业 采取 上 述 触 发 战略 成 为 纳什 均衡 , 必须 
满足 

Gig teat oom (2.3.2) 
此 式 和 分 析 办 徒 困境 时 的 (2.3.1) 式 是 相似 的 。 将 nnan na 的 值 带 入 
《2.3.2) 可 得 8 之 9/17。 由 于 与 前 一 节 相 同 的 原因 ,这 一 纳 付 均衡 又 是 子 博 
弈 精炼 的 。 

我 们 可 以 进一步 追问 如 果 8 之 9/17, AMT. RRE 
运用 上 一 节 讲 过 的 两 种 方法 。 首 先 来 计算 对 任意 一 个 给 定 的 6 值 ,如 果 双 
方 都 采用 触发 战略 , 一 旦 出 现 背 高 就 永远 转 到 古 诺 产 出 ,企业 可 以 达到 的 利 
润 最 大 化 的 产量 。 我 们 已 经 知道 , 这样 的 触发 战略 不 能 支持 低 到 垄断 产 出 
一 半 的 产量 ,但 对 任意 5 的 值 , 永远 简单 重复 古 诺 产量 却 都 是 一 个 子 博 弃 
精炼 纳什 均衡 。 从 而 , 触发 战略 可 以 支持 的 利润 最 大 化 产量 处 于 gq/2 和 
q 之 间 。 为 计算 这 一 产量 ,考虑 如 下 的 触发 战略 , 

第 一 阶段 生产 9“。 在 第 上 阶段 ,如果 在 此 之 前 的 :一 1 个 阶段 两 
企业 的 产量 都 是 9" ,生产 g” ;否则 ,生产 古 诺 产 出 gq。。 

如 果 双 方 都 生产 g" ,每 个 企业 的 利润 为 (ae - 2g” 一 <)9 ' ,我 们 用 x" 
RR. WRAAE i 计划 在 当期 生产 9*, 则 使 企业 /当期 收益 (利润 ) 最 大 化 
的 产量 为 下 式 的 解 : 


max(a—q@* -c)a; - 
4% 


BURA g; = (a - q" — c)/2, 相应 的 利润 为 (a - 9”- c)2/4, RAV xe 
表示 。 当 下 式 成 立时 ,两 个 企业 都 果子 上面 给 出 的 秀 发 战略 为 纳什 均衡 


giye >rat Ts 


解 由 此 式 形 成 的 关于 q 的 二 次 方程 , 可 得 令 上 面 给 出 的 触发 战略 成 为 子 
博弈 精 烧 纳什 均衡 的 9 
+ 9-58 
9 =3(9- 8) 647) > 
它 随 3 单调 递减 ,上 且 当 6 达到 9/17 时 ,达到 ge/2, 4 F 达到 0 时 达到 geo 


下 面 我 们 斌 着 使 用 第 二 种 方法 , 它 的 出 发 点 是 威胁 使 用 最 严 丙 的 可 信 
的 您 昼 。 阿 布 蔓 (1986) 将 这 一 思路 运用 于 古 庶 模 型 中 , 比 我 们 使 用 一 个 任 
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意 的 贴现 因子 更 具有 一 般 性 :这 里 只 简单 证 明 在 我 们 的 模型 中 , 如 果 用 阿布 
勒 的 方法 .在 3 = 1/2( 小 于 gq/17) 时 ,也 可 以 达到 垄断 产量 。 考 虚 下 面 的 
“PATH” (two-phase) (AR PR AAS P WKAR ( carrot-and-stick) ) ARMS ; 

在 第 一 阶段 生产 董 断 产量 的 一 半 , g， /2。 第 : 阶段 , 如 果 两 个 企 

业 在 第 :一 1 阶段 都 生产 gs。y2, 则 生产 g。y2; 如 果 两 个 企业 在 上 — 1 阶 

BAERE c, WE en/2; 其 他 情况 下 生产 z。 

这 一 战略 为 参与 者 提供 了 两 种 手段 :其 一 是 ( 单 阶段 的 ) 惫 罚 ,这 时 企业 生产 
zj; 其 二 是 (潜在 无 限 阶 段 的 ) 合 作 , 这 时 企业 的 产量 为 ge/2。 如 果 任 何 一 
个 企业 偏离 了 合作 , 则 惩罚 开始 , 如果 任何 一 个 企业 背离 了 竹 罚 , 则 会 使 博 
弈 进入 又 一 轮 惩 罚 。 如 果 两 个 企业 都 不 背离 惩罚 , 则 在 下 一 阶段 又 回 到 合 
TE. 

如 果 两 企业 都 生产 z, 每 个 企业 的 利润 为 (a -2z - c)z, 我 们 用 rla) 
表示 。 令 Vtz) 表 示 当 期 的 利润 为 n(x), 以 后 每 阶段 的 利润 永远 是 垄断 利 
润 的 一 半 , 企业 总 收益 的 现 值 : 

ê .1 


V(r)=r(r) + pg Z" - 


如 果 企 业主 计划 在 当期 生产 z, 则 使 企业 福利 润 最 大 化 的 产 出 为 干 式 的 解 


max(a -q;-x-c)q;- 


其 解 为 y= la-a- <)/2, 相 应 的 利润 为 (a - a- 07/4, BA npl) 
示 , 其 中 ap Oe LEM ET A. 

如 果 两 家 企业 都 采用 上 面 的 两 面 战略 , FT oF PRE 
可 归 为 王 类 : (i) 合作 的 子 博 蛮 ,其 前 面 一 个 阶段 的 结果 是 ( 9,,/2, 0/2) È 
(z+);(ii) 德 罚 的 子 博 弈 ,其 前 面 一 个 阶段 的 结果 既 非 (gw/2, qm/2), 又 不 
是 (x, x)。 两 企业 都 采取 上 面 的 两 面 战略 要 成 为 一 个 子 博 认 精炼 纳什 均 
i, 则 在 其 每 一 类 子 博 蛮 中 遵 德 该 战略 必须 是 纳什 均衡 。 具 体 地 说 , 在 合作 
BTR F, 每 一 企业 与 本 期 得 到 x 的 收益 , 且 下 期 得 到 悉 蚀 的 现 值 收益 
vt(z) 相 比 ,必须 更 愿意 永远 得 到 区 断 收益 的 一 半 : 


pig pert V(r) . (2.3.3) 


LETTE P, 每 一 企业 与 本 期 得 到 xs 的 收益 . 且 下 期 又 开始 惩罚 相 
He, ash RSS INT ET E: 

Vix may (2) t+ Vic) - (2.3.4) 
将 V(z) 代 入 (2.3.3) 可 得 
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它 表示 , 在 本 期 背离 所 得 的 好 处 必须 不 大 于 下 一 期 惩罚 带 来 损失 的 现 值 (很 
设 两 个 企业 都 不 背离 悉 罚 期 , 则 下 一 阶段 之 后 就 没有 损失 了 ,因为 惩罚 已 经 
结束 , 企业 又 回 到 垄断 产 出 ,就 像 根 本 没 发 生 过 背 高 一样)。 同 样 , (2.3.4) 
又 可 写成 


a anale Drala) nla), 


其 含义 与 凸 面 是 相似 的 。 对 5= 1/2, 如果 z/(a -<) 不 在 178 到 3/8 Z7, 
(2.3.3) 式 即 可 满足 ,并 且 如 果 z/(a — ALF 3/10 到 1/2 2A, (2.3.4) 
式 亦 可 满足 。 从 而 ,对 8 = 1/2 可 达到 菊 断 产 出 的 两 面 战 略 成 为 子 博 穿 精 
炬 纳什 均衡 的 条 件 是 3/78 生 zy/(a 一 所 1/2。 

此 外 ,还 有 许多 其 他 的 动态 窒 头 垄断 模型 , 内 容 比 这 里 介绍 的 简单 模型 
更 加深 入 和 丰富 。 在 本 节 最 后 , 我们 简要 讨论 这 些 模型 中 的 两 类 :状态 变量 
《state-variable) 模 型 和 不 完美 监督 (imperfect-monitoring) 模 型 。 两 类 模型 除 
寡头 垄断 之 外 还 有 许多 应 用 ,例如 ,下 一 节 介绍 的 效率 工资 模型 恒 是 不 完美 
监督 的 一 个 例子 。 

罗 腾 贝 烙 和 萨 隆 纳 (Rotemberg & Saloner, 1986 及 习题 2.14) 通 过 人 允许 
需求 函数 的 截 距 在 不 同 阶段 随机 波动 , 研究 了 存在 南 业 周 期 时 的 串 谨 。 在 
每 一 阶段 ,所 有 企业 在 选择 该 阶段 的 行动 之 前 都 可 观测 到 那 一 阶段 需求 函 
数 的 截 距 ;在 另外 的 应 用 中 ,参与 者 在 每 一 阶段 的 开始 可 以 观测 到 另 一 个 状 
态 变 量 的 值 。 这 种 情况 下 , 背离 一 个 给 定 战 略 的 动机 不 仅 惊 赖 于 当期 的 涡 
求 值 , 还 决定 于 将 来 阶段 可 能 的 需求 。( 罗 腾 贝 格 和 萨 隆 纳 假定 需求 在 各 阶 
段 是 独立 的 , 这 样 对 后 面 的 考虑 与 当期 的 需求 值 也 是 独立 的 ,但 其 后 的 研究 
放松 了 这 一 假定 。) 

格林 和 波 特 (Green & Porter, 1984) 研 究 了 在 背离 无 法 完美 地 被 观测 时 
的 共 谋 :企业 不 再 能 观测 到 另外 企业 的 产 出 选择 ,每 个 企业 只 能 观测 到 市 场 
出 清 价格 , 而 这 一 价格 在 每 一 阶段 又 会 受到 无 法 观测 的 因素 的 冲击 。 在 这 
样 的 条 件 下 , 企业 无 法 分 辨 市场 出 清 价 格 的 降低 是 由 于 另外 企业 背离 形成 
的 ,还 是 其 他 不 利 因素 的 冲击 带 来 的 。 格 林 和 波 特 检验 了 触发 价格 均衡 , 其 
中 ,任何 低 于 触发 水 平 的 价格 都 会 引发 一 个 无 罚 阶段 ,在 息 罚 阶段 所 有 企业 
MERTE H. CHERT, 没有 企业 会 背离 。 然 而 ,市 场 因素 一 次 严 
重 的 不 利 冲击 也 会 使 价格 降 至 触发 点 之 下 ,从 而 引发 一 个 迁 罚 阶段 ,由 于 和 无 
罚 是 由 偶然 因素 引发 的 ,本 节 所 分 析 的 触发 战略 里 御 罚 将 无 限 地 持续 下 去 
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的 司法 就 不 再 是 最 优 的 ,而 由 阿布 勒 分 析 的 两 面 战 略 更 为 合理 , 事实 上 , 阿 
AB) IR SA He HGR (Pearce & Stacchetti, 1986) 证 明了 它们 可 以 成 为 
最 优选 择 。 


2.3.D 效率 工资 


在 效率 工资 的 模型 中 , 一 个 企业 劳动 力 的 产 出 决定 于 企业 支付 的 工资 
水 平 。 在 发 展 中 国家 的 环境 中 , 更 高 的 工资 收入 可 提供 更 好 的 营养 ;在 发 达 
BR, 更 高 的 工资 收入 可 吸引 更 多 有 能 力 的 工人 到 企业 求职 ,或 者 可 以 激励 
现 有 工人 更 加 努力 工作 。 

政 皮 罗 和 施 蒂 格 里 蒋 (1984) 就 此 建立 了 一 个 动态 模型 , 其 中 企业 为 汶 
励 工 人 努力 工作 , 一 方面 支付 很 高 的 薪水 ;同时 又 威 肋 一 旦 被 发 现 偷 濑 , 立 
即 开除 。 作 为 这 种 高 薪 的 一 个 后 果 , 企 业 减 少 了 对 劳动 力 的 需求 , 造成 部 分 
工人 的 高 薪 就 业 ,但 其 他 工人 ( 非 自愿 ) 失 业 并 存 。 失 业 工人 的 人 数 越 多 , 一 
个 被 解雇 的 工人 寻找 新 的 工作 岗位 所 需 时 间 越 长 , 于 是 解雇 的 威胁 就 更 加 
有 效 。 在 竞争 鸭 衡 条 件 下 , 工资 水 平 w 和 失业 率 z 恰好 可 以 使 工人 不 去 偷 
懒 ,并 且 企 业 在 工资 水 平 w 时 的 劳动 需求 恰好 使 失业 率 等 于 zx。 我 们 分 析 
一 个 企业 和 一 个 工人 的 情况 , 从 重复 博弈 的 角度 研究 这 一 模型 (而 不 考虑 其 
竞争 均衡 的 特点 )。 

考虑 如 下 的 阶段 博弈 :第 一 ,企业 对 工人 开 出 一 个 工资 水 平 w; 第 二 ， 
工人 接受 或 拒绝 企业 的 开价 。 如 果 工 人 拒绝 了 w, 则 工人 成 为 自我 雇 俩 
者 ,工资 水 平 为 wo, 如 果 工 人 接受 了 w, 则 工人 选择 是 努力 工作 (会 带 来 e 
的 负 效 用 ) 还 是 偷懒 (不 会 带 来 任何 负 效 用 )。 工 人 对 努力 程度 的 决策 企业 
无 法 观测 , 但 企业 和 工人 都 可 观测 到 工人 的 产 出 水 平 。 产 出 可 能 高 也 可 能 
低 ,为 简单 起 见 ,我们 认为 低 水 平 的 产 出 为 0, 高 水 平 的 产 出 为 y>>0。 RE 
如 果 工 人 努力 工作 则 肯定 可 以 得 到 高 产 出 , 但 如 果 工 人 偷懒 则 以 p 的 概率 
得 到 高 产 出 ,1 一 p 的 概率 得 到 低产 出 。 从 而 , 在 此 模型 中 , 低产 出 是 偷懒 无 
WY ERA TERE 

假设 企业 以 w 的 工资 雇佣 了 工人 ,那么 如 果 工 人 努力 工作 , 带 来 高 产 
出 时 参与 入 的 收益 分 别 为 :企业 yzw, 工 人 we. MRT AI, N e 变 
为 0; 部 困 出 现 低产 出 , 则 yy 变 为 0。 我 们 假定 y- e> w> py, 从 而 对 工人 
来 讲 , 受 雇 于 企业 并 且 努 力 工作 是 有 效率 的 , 工人 自我 雇佣 要 优 于 受 雇 于 企 
业 并 偷懒 。 

这 一 阶 自 博 弈 的 子 博 弈 精炼 解 是 使 人 失望 的 :因为 企业 先 付 给 工人 工 
资 ww, 工 人 没有 动机 去 努力 工作 ,于 是 企业 将 开 出 w =0( 或 尾 何其 他 的 w 
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<w I) ETARRHRAM. Bit, 在 无 限 重复 博弈 中 , 企业 通过 给 工人 高 
于 wo 的 工资 水 平 w, 并 且 威 胁 一 旦 尾 产 出 出 现 ,就 将 工人 开除 , OT 
励 工 人 努力 工作 的 。 下 面 我 们 证 明 在 某 些 取 值 范围 内 , 企业 给 出 较 高 的 工 
资 并 借 此 激励 工人 努力 工作 是 值得 的 。 

我 们 也 许 会 想 ,为 什么 企业 和 工人 不 能 签订 一 个 依据 产 出 水 平 的 补偿 
合同 , 从 而 激励 工人 努力 工作 。 这 样 的 合同 也 许 不 合适 , 原因 之 一 是 法 院 要 
执行 这 样 的 合约 将 十 分 困难 ,也 许 因为 对 产 出 合适 的 计量 方法 包含 了 产 出 
的 质量 .生产 条 件 方面 预想 不 到 的 困难 等 等 。 更 为 一 般 地 讲 , 依赖 于 产量 的 
合约 总 不 会 是 完美 的 (并 不 是 完全 不 可 行 ), 但 对 这 里 我 们 研究 重复 博弈 中 
的 激励 仍 有 一 定 作 用 。 

考虑 无 限 重 复 博弈 中 下 面 的 战略 , 其 中 包含 了 将 在 以 后 决定 的 w" > 
wo。 如 果 所 有 前 面 的 工资 开价 都 是 w” ,所 有 的 开价 都 被 接受 了 , 并 且 所 
有 前 期 的 产 出 都 是 高 的 , 我 们 就 称 博弈 的 过 程 是 “高 工资 高 产 出 ”。 企 业 的 
战略 为 第 一 阶段 开 出 工资 水 平 w = w ,并且 在 其 后 的 每 一 阶段 , RE 
的 过 程 是 高 工资 高 产 出 , 则 继续 开 出 工资 水 平 w” ;但 其 他 情况 下 开 出 w 
=0。 工 人 的 战略 为 如 果 w> wo, 则 接受 企业 的 工资 (否则 ,选择 自我 雇 
M, 并 且 如 果 博 弈 的 过 程 (包括 本 阶段 的 工资 ) 是 高 工资 高 产 出 , 则 努力 工 
fe BG). 

企业 的 战略 类 似 于 前 两 节 所 分 析 的 触发 战略 :如 果 在 前 面 所 有 阶段 的 
博弈 中 都 相互 合作 就 继续 合作 , 但 一 旦 有 一 次 合作 被 打破 ,就 水 远 转向 阶 和 发 
博弈 的 了 于 博弈 精 炬 解 。 工 人 的 战略 也 类 似 于 这 样 的 触发 成 略 , 但 由 于 工人 
在 序 贯 行动 的 阶段 博弈 中 的 行动 在 后 , 其 战略 也 更 加 灵活 一 些 。 在 一 个 基 
于 同时 行动 阶段 博弈 的 重复 博弈 中 , 一方 的 背离 只 能 在 某 一 阶段 结束 时 才 
可 观测 到 ;不 过 当 阶 段 博弈 是 序 贯 行动 时 , 首先 行动 方 的 背离 在 同一 阶段 就 
可 被 观测 到 (并 且 可 对 其 作出 反应 )。 工 人 的 战略 将 会 是 :如 果 前 面 所 有 阶 
段 的 博弈 都 合作 则 继续 合作 ,但 如 果 企 业 一 旦 有 上 背离 就 选择 自己 本 阶段 的 
最 优 行动 ,因为 他 知道 将 来 所 有 阶段 的 博弈 都 将 出 现 阶段 博弈 的 子 博弈 精 
Re. FRM, 如果 ww’ ,但 ww 之 wo, 则 工人 将 接受 企业 的 工资 但 选 
FE. 

下 面 我 们 将 导出 上 述 双 方 的 战略 成 为 子 博弈 精炼 纳什 均衡 的 条 件 。 
前 面 两 节 中 一 样 ,论证 由 两 部 分 组 成 : (i) 导 出 双方 战略 成 为 纳什 均衡 的 条 
件 , (这 证 明 它 们 是 子 博弈 精炼 的 。 

假设 企业 在 第 一 阶段 开 出 的 工资 是 w"。 给 定 企业 的 战略 , 工人 接受 
这 一 工资 水 平 是 最 优 的 。 如 果 工 人 努力 工作 , 则 他 可 以 肯定 得 到 高 产 出 , 那 
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么 企业 将 再 次 开 出 工资 水 平 w* ,而 工人 将 在 下 一 阶 跨 就 努力 与 否 进行 相 
同 的 决策 。 从 而 , 如果 对 工人 来 讲 努力 工作 是 最 优 的 , 则 工人 收益 的 现 值 为 
V.=(w"-e)+8V, 或 V,=(w*-e)/(1-8). 

Bik, MARTA, 则 工人 将 以 p 的 概率 得 到 高 产 出 ,这 时 下 一 阶段 他 还 
可 以 就 努力 与 否 进行 决策 ;但 工人 还 将 以 1 一 p 的 概率 得 到 低产 出 ,这 时 企 
业 将 在 以 后 永远 开 出 工资 w=0, 于 是 工人 亦 将 永远 选择 自我 启明 。 从 而 ， 

如 果 对 工人 来 讲 偷 籁 是 最 优 的 , 则 工人 收益 的 现 值 ( 期 望 值 ) 为 


Viz w" tolpV + (1— pip st 


或 
V,=[(1- 8) w* + SCL — p)wo]/C1- 8,)€1- 8) - 

对 工人 来 讲 , MR V. > V, 选择 努力 工作 是 最 优 的 , 即 

w Bwot gq eye = wet (+t). (2.3.5) 
于 是 ,为 激励 工人 努力 工作 ,企业 必须 向 工人 支付 的 ,不 仅 足 以 补偿 工人 自 
我 雇 镍 时 的 机 会 收入 以 及 努力 工作 带 来 的 负 效 用 wo + e 还 包含 工资 升水 
(1-8)e/8(1— p). WARIL, MIR p 接近 于 1( 即 如 果 偷 懒 很 难 被 发 现 )， 
则 工资 升水 必须 非常 高 才 可 以 激励 工人 努力 工作 。 另 一 方面 , 如果 p =0， 
则 在 下 式 成 立时 ,工人 努力 工作 是 最 优 的 

Taw -ew tT . (2.3.6) 
上 式 的 导出 与 前 两 节 关 于 完美 监督 的 分 析 中 (2.3.1) 和 (2.3.2) 相 似 , 而 
{2.3-6) 又 可 以 化 为 下 式 : 
l-8 


wi Swett F Je, 


它 的 确 是 (2.3.5) 中 p= 0 METER. 
即使 (2.3.5) 成 立 , 从 而 令 工人 的 战略 为 其 对 企业 战略 的 最 优 反 应 ,还 
应 该 研究 企业 支付 w" 是 否 慎 得 。 给 定 工人 的 战略 , 企业 在 第 一 阶段 的 问 
题 可 归 为 就 以 下 进行 选择 :{1) 支 付 w = ww ' ,并 通过 威胁 工人 一 旦 出 现 低 
产 出 就 将 其 开除 来 激励 工人 努力 工作 ,这样 每 一 阶段 都 可 得 到 y - w" 的 收 
益 ; 和 (2) 支 付 w=0, 促 使 工人 选择 自我 雇佣 , 自己 在 每 一 阶段 的 收益 均 为 
01。 于 是 ,企业 战略 成 为 工人 战略 最 伐 反 应 的 条 件 为 
yow Do. (2.3.7) 
前 面 我 们 已 假定 y- e> roo( 即 对 工人 而 言 ,选择 受 雇 于 企业 并 努力 工作 是 
有 效率 的 )。 但 要 使 双方 战略 成 为 子 博弈 精炼 纳什 均衡 , 我 们 还 要 求 进一步 
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的 条 件 :(2.3.5) 和 (2.3.7) 合 并 为 


yo eR wot tp 


对 此 , 我 们 仍 可 以 沿用 前 面 的 解释 , 即 要 使 合作 能 够 得 以 维持 , 贴现 因子 8 
的 值 必须 足够 大 。 

到 此 为 止 ,我们 已 证 明 如 果 (2.3.5) 和 (人 《2.3.7) 成 立 , 则 前 面 给 出 的 战略 
为 纳什 均衡 。 为 证 明 这 些 战 略 同时 又 是 子 博弈 精炼 的 , 首先 需 定义 原 重复 
CENTER. RIMM, 在 阶段 博弈 为 同时 行动 时 , 重复 博弈 的 子 博 
弈 由 原 重 复 博 弈 的 两 个 阶段 之 间 开 始 , 在 这 里 分 析 的 阶段 博弈 为 序 芮 行动 
的 情况 下 , 子 博弈 不 仅 在 阶 般 之 间 开 始 , 还 可 以 始 于 每 一 阶段 之 中 一 一 在 工 
人 观测 到 企业 给 出 的 工资 水 平 以 后 。 给 定 参 与 者 的 战略 ,我 们 可 以 把 子 博 
FAA TELI aS SE, 以 及 其 他 进行 过 程 之 后 的 
子 博弈 。 我 们 已 证 明 前 一 种 博弈 进行 过 程 下 , 参与 者 的 战略 为 纳什 均衡 , 余 
下 的 就 是 要 证 明 后 一 种 过 程 下 的 情况 :由 于 工人 将 来 不 再 会 努力 工作 , 企业 
促使 工人 选择 自我 就 业 是 最 优 的 ;由 于 企业 将 在 下 一 阶段 及 其 后 永远 支付 
工资 w=0, 工 人 在 当前 阶段 也 不 会 努力 工作 , 并 只 有 在 w 之 wo 时 才 会 接 
受 给 付 的 工资 。 

在 这 一 均衡 中 ， 自我 雇 全 是 永远 性 的 ， ORLA BA RE M, 
则 企业 在 其 后 将 永远 给 付 工资 w = 0; 如 果 企 业 曾 偏离 w= we (最 优 工 
资 ), 则 工人 将 水 不 再 努力 工作 , 于 是 企业 也 不 会 再 竣 佣 这 个 工人 。 可 以 有 
很 多 理由 对 这 种 永远 自我 雇佣 的 合理 性 提出 疑问 。 在 我 们 单一 企业 ,单一 
工人 的 模型 中 , 和 永远 选择 阶段 搏弈 的 子 博弈 精炼 解 相 比 ,双方 参与 者 都 会 
更 感 意 回 到 无 限 重 复 博 弈 的 高 工资 .高产 出 均衡 去 , 这 涉及 到 第 2.3.A 节 
介绍 过 的 重新 谈判 。 当 时 担 到, 如 果 参 与 者 知道 惩罚 将 不 会 被 执行 , 则 以 这 
种 翘 罚 相 威胁 促成 的 合作 恒 不 再 是 一 个 均衡 。 

在 存在 劳动 力 市 场 的 情况 下 ,如 果 企业 同时 雇 修 了 许多 工人 , 则 它 更 倾 
向 于 不 进行 重新 谈判 ,因为 和 一 个 工人 的 重新 谈判 会 使 处 于 高 工资 \ 高 产 出 
均衡 的 其 他 工人 (或 将 要 选择 这 一 均衡 的 工人 ) 十 分 失望 而 改变 战略 。 如 果 
存在 许多 企业 , 问题 成 为 企业 j 是 否 会 雇佣 以 前 企业 i 曾 雇佣 的 工人 。 合 
理 的 结果 可 能 是 “ 否 ”, 因为 它 担心 会 使 现 有 高 工资 .高 产 出 的 工人 失望 , 正 
如 一 个 企业 的 情况 一 样 。 诸 如 此 类 的 原因 可 以 解释 为 什么 日 本 大 企业 间 白 
ABO RE BARS MAE. 

换 一 种 情况 ,如 果 被 解雇 的 工人 总 可 以 找到 比 自我 雇佣 更 喜欢 的 工作 ， 
则 这 时 那些 新 工作 的 工资 ( 减 去 努力 带 来 的 负 将 用) 就 起 到 了 自我 雇佣 收入 
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wo 的 作用 。 在 一 个 被 解雇 工人 根本 不 会 受到 任何 损失 的 极端 情况 下 ,在 
无 限 重复 博弈 中 无 法 提供 对 偷 籁 有 效 的 惩罚 ,从 而 也 不 存在 工人 将 努力 工 
TAF AREA, SMA AP (Bulow & Rogoff, 1989) 就 
同一 思路 提供 的 一 个 关于 国家 债务 的 精致 的 例子 :如 果 一 个 债务 国 能 够 在 
国际 资本 市 场 上 通过 预先 收 款 的 短期 交易 重复 从 伟 权 国 借 人 长 期 贷款 , 则 
在 无 限 重 复 博 灾 中 对 债务 国 和 债权 国之 同 的 违约 行为 就 没有 一 个 可 行 的 悉 
罚 方案 。 


2.3.6 时 间 一 致 性 的 (Time-Consistent) 货币 政策 


考虑 如 下 序 贯 行动 博弈 ,其 中 雇主 和 工人 就 名 义工 资 进行 谈判 ,之 后 货 
币 当 局 选择 货币 供给 ,货币 供给 量 又 决定 了 通货 脱 胀 率 。 如 果 工 次 合同 无 
法 完美 地 指数 化 ,雇主 和 工人 在 决定 工资 时 都 将 尽力 去 预测 通货 膨胀 的 因 
素 。 不 过 , 一 个 不 完美 指数 化 的 名 义工 资 一 旦 设 定 ,真实 的 通货 赔 胀 率 如 高 
FRM RRS, 将 会 使 工人 实际 收入 下 降 , 导 致 雇主 扩大 寥 人 人 数 ， 
扩张 生产 。 这 样 货币 当局 也 要 就 通货 膨胀 成 本 和 意料 之 外 的 通货 膨胀 使 失 
业 率 降低 及 总 产 出 提高 之 间 进 行 权衡 ( 妈 高 于 预测 水 平 之 上 的 通货 膨胀 )。 

我 们 用 下 面 的 阶段 博弈 来 分 析 这 一 问题 的 简化 形式 ,参见 巴 罗 和 姜 合 
(Barro & Gordon.1983)。 首 先 .雇主 形成 一 个 对 通货 陪 胀 的 预期 值 x :第 
二 ,货币 当局 观测 到 这 一 预期 并 选择 真实 的 通货 朵 胀 率 +。 雇主 的 收益 为 
《x 一 x*)?。 即 筷 主 总 是 简单 地 试图 正确 预测 通货 膨胀 率 , 在 x = x 时 他 
们 达到 收益 最 大 化 (最 大 化 收益 为 0)。 货 币 当 局 从 自身 目标 出 发 , 希望 通 
货 脱 账 率 为 0, 但 产 出 (yy) 能 达到 有 效率 的 水 平 (y" )。 我 们 可 以 把 货币 当 
局 的 收益 用 下 式 表示 : 

Ula, y= — ex? (yy) 
其 中 的 参数 c >0 代表 了 货币 当局 在 两 个 目标 之 间 的 蔡 代 关系 。 假 设 真实 
产 出 可 表示 为 如 下 的 目标 产 上 出 和 意料 外 通货 膨胀 的 函数 : 
y=by" +d(r- r), 
其 中 ,5 <1 反映 了 产品 市 场 上 垄断 力量 的 存在 (从 而 如 果 没 有 意料 外 的 通 
货 膨 胀 则 真实 产 出 小 于 有 效率 的 产 出 水 平 ), 且 4 >0 表示 意料 外 通货 膨胀 
通过 真实 工资 对 产 出 的 作用 , 正如 前 面 一 段 已 经 提 到 的 。 由 此 我 们 可 以 将 
货币 当 妨 的 收益 重新 表示 为 
Wix, x)= -er -l(b -ly tdir- a )F. 

为 解 出 这 一 阶段 博弈 的 子 捕 弈 精炼 解 , 首先 我 们 计算 对 给 定 的 雇主 期 

刻 的 通货 彩 帐 率 二 ,货币 当局 的 最 优选 择 。 令 Wir, r RKT 
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d 
e+? 
由 于 雇主 们 预测 到 货币 当局 将 选择 r” (r), BEHORRA EA r, - 
La’ Cat) nt] 最 大 化 ,得 到 w*(x)=x* 或 
d(i~4) 


有 


其 中 x 的 脚 标 * RT “BPE PBR” (stage game)。 由 此 , 我 们 可 以 等 价 地 
说 , 座 主 持 有 的 理性 期 望 值 为 将 在 随后 被 货币 当局 所 确认 证 实 的 通货 膨胀 
水 平 ,因为 x* a) = x', 从 而 又 有 w= xs。 当 雇 主持 有 的 期 望 值 x* = x 
时 ,货币 当局 设 定 的 x 略 高 于 r, 的 边际 成 本 刚好 抵消 掉 意 料 外 通货 膨胀 的 
边际 利益 。 在 这 一 子 博弈 精 炬 解 中 , 货币 当局 被 预测 到 要 实施 通货 及 胀 ,并 
且 事 实 上 也 是 如 此 ,但 如 果 它 能 承诺 不 实行 通货 膨胀 政策 就 可 提高 其 福利 
水 平 。 事 实 上 , 如 果 雇 主 们 持 有 理性 预期 ( 即 x = x), 零 通货 脱 胀 率 将 使 货 
币 当局 的 收益 达到 最 大 ( 即 当 = a 时, WC, at) = ent- (8-1)? "2, 
这 时 x =0 是 最 优 的 )。 

现在 考虑 双方 参与 者 的 贴现 因子 都 为 8 时 无 限 重 复 博弈 的 情况 。 我 
们 将 导出 双方 的 下 述 战 略 成 为 子 博弈 精炼 纳什 均衡 的 条 件 , 从 而 使 每 一 阶 
B = 六 =0。 在 第 一 阶段 ,雇主 们 持 有 预期 r = 人 0, 在 其 后 各 阶段 , 如果 所 
有 前 期 的 预期 x* 都 为 0 并 且 所 有 前 期 的 真实 通货 膨胀 率 x 也 都 为 0, 则 持 
有 预期 x* =0, 否则 ,雇主 持 有 预期 x* = x, 一 一 从 阶段 博弈 导出 的 理性 预 
期 。 相 似 地 , 在 当期 预期 x* =0 并 且 所 有 以 前 的 预期 六 都 为 0, 且 所 有 以 
前 的 真实 通货 岂 胀 率 x 都 为 0 时 ,货币 当局 选择 令 x =0 的 货币 供给 ; 否 
SU, MRR a =a" fm) Oe Fe SE AY, 正如 (2.3.8) 
给 出 的 。 

假设 寥 主 们 在 第 一 阶段 持 有 的 通货 膨胀 预期 为 r =0。 给 定 雇主 们 
的 战略 ( 即 在 雇主 们 观测 到 真实 的 通货 赠 胀 水 平 之 后 对 其 预期 的 调整 方 
式 ) ,货币 当局 可 以 只 集中 考虑 对 如 下 两 个 方案 的 选择 ;(1)w =0, 它 将 
使 下 一 阶段 的 x* = 0, 从 而 使 货币 当局 在 下 一 阶段 仍 可 面临 同样 的 选 
择 ; 及 (2) 从 (2.3.8) 式 计算 得 出 的 阶段 最 优选 择 x = x "(0), 它 将 使 得 
此 后 所 有 的 x= x,, 这 种 情况 下 货币 当局 将 发 现 此 后 永远 选择 x = r, 
也 是 最 优 的 。 在 本 期 选择 x =0 可 使 得 每 一 期 的 收益 均 为 WW(0,0), 而 
在 本 期 选择 x 二 x"(0) 可 使 本 期 的 收益 为 W(x* (0),0), 人 得 其 后 每 期 
的 收益 永远 为 W(x,, x;)。 从 而 ,当下 式 成 立时 , 货币 当局 的 战略 是 雇 
主 调整 方式 的 最 优 反应 ; 


和 《区 ) 一 [C1-6)y” + dat] . (2.3.8) 
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TWO 00> wn (00) + EWG) (2.3.9) 


此 式 与 (2.3.6) 是 类 似 的 。 

通过 对 (2.3.9) 的 简化 可 得 3 六 cy/(2c+ d?)。 参 数 c Md 都 起 到 两 方 
面 的 效果 。 例 如 ,在 d 增 大 时 , 可 使 意料 之 外 的 通货 膨胀 对 产 出 影响 的 效 
果 增 大 ,但 同样 的 原因 a 的 增 大 又 使 得 阶 眉 博 弃 的 解 x, 增 大 ,后 者 又 增 大 
了 惩罚 对 货币 当局 的 效果 。 类 似 地 ,< 的 增 大 使 得 通货 肝 胀 更 为 痛苦 。 从 
而 使 意料 外 通货 膨胀 吸引 为 减 小 ,但 同时 又 使 x, 下 降 。 在 两 种 情况 下 , 后 
一 作用 都 超过 了 前 一 影响 ,因而 贴现 因子 的 临界 值 也 必须 支持 这 一 均衡 : 
c</(2c+d2) 随 4 的 增 大 而 递减 , 随 < 而 递增 。 

至 此 , 我 们 已 证 明了 如 果 (2.3.9) 式 成 立 , 货 币 当局 的 战略 是 和 雇主 战略 
的 最 优 反应 。 要 证 明 这 一 组 战略 是 纳什 均衡 , 还 须 证 明 后 者 是 前 者 的 最 优 
反应 。 我 们 可 以 看 到 , 根据 这 一 战略 ,雇主 们 每 一 期 都 可 得 到 其 最 优 的 可 能 
收益 ( 即 为 0), 因此 雇主 的 战略 是 最 优 战 略 。 证 明 这 一 组 战略 是 子 博弈 精 
炼 的 程序 与 上 一 节 相 似 。 


2.4 完全 非 完美 售 息 动 态 情 弃 


2.4.4 ”博弈 的 扩展 式 表 述 


在 第 1 章 我 们 运用 博弈 的 标准 式 表 述 分 析 了 静态 博 穿 , 这 里 我 们 引入 
博弈 的 扩展 式 表述 并 用 它 分 析 动 态 博弈 .9 这 一 解释 方法 可 能 会 给 人 一 个 
印象 , 那 就 是 静态 博弈 一 定 要 用 标准 式 表述 , 动态 博弈 一 定 要 用 扩展 式 表 
述 。 但 这 是 一 种 误解 , 任何 博弈 都 既 可 以 用 标准 式 表述 ,又 可 以 用 扩展 式 表 
述 , 尽 管 对 某 些 博 弈 来 讲 , 用 其 中 一 种 表述 形式 分 析 起 来 较 另 外 一 种 要 方便 
一 些 。 我 们 将 讨论 如 何 利用 扩展 形式 表述 一 个 静态 博弈 ,以 及 如 何 利用 标 
准 式 来 表述 一 个 动态 博弈 。 

在 第 1.1.A 节 曾经 讲 过 ,一 个 博弈 的 标准 式 表述 包含 的 要 束 有 :(1) 博 
弈 的 参与 人 ;(2) 每 一 参与 人 可 供 选 择 的 战略 ,及 (3) 与 参与 者 可 能 选择 的 每 
一 战略 组 合 相对 应 的 各 个 参与 者 的 收益 。 


中 本 书 只 给 出 扩展 式 的 非 正式 描述 , 要 进一步 T 解 精确 的 理论 , HOF UE MARAT 
(198230. 


“a 
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定义 ”一 个 博弈 的 扩展 式 表述 包括 : (1) 博 弈 中 的 参与 人 ;(2a) 每 一 参 
与 者 在 何 时 行动 ; (2b) 每 次 轮 到 某 一 参与 者 行动 时 , 可 供 他 选择 的 行动 ; 
〈2c) 每 次 轮 到 某 一 参与 者 行动 时 , 他 所 了 解 的 信息 :及 (3) 与 参与 者 可 能 选 
择 的 每 一 行动 组 合 相对 应 的 各 个 参与 者 的 收益 。 


事实 上 , 在 第 2.1 到 2.3 节 我 们 已 经 分 析 过 几 个 用 扩展 式 表 述 的 博弈， 
尽管 当时 没有 明确 这 一 纪 念 。 本 节 的 主要 内 容 是 引入 博弈 树 描述 博弈 的 扩 
RR, 而 不 是 文字 描述 , 因为 前 者 在 通常 情况 下 更 使 于 表示 和 和 分析。 


参与 者 1 的 收益 3 1 $ 
参与 者 2 的 收益 1 2 1 


oo 


® 2.4.1 


作为 博 窃 扩展 式 表述 的 一 个 例子 , SERTE 2.1.A 节 介 绍 过 的 完全 
且 完 美 信息 两 阶段 博弈 的 一 个 具体 例子 : 

1. 参与 者 1 从 可 行 集 A = {L,R PERI ai; 

2. 参与 者 2 观测 到 a1, 然后 从 可 行 集 4: = IL, R“1 中 选择 行动 xz: 

3. 两 参与 者 的 收益 分 别 为 w1(a1, ez) 和 w2(a1,az), 如 图 2.4.1 的 博 
弈 树 所 示 。 

这 一 博弈 树 始 于 参与 者 1 的 一 个 决策 节 (decision node), 这 时 1 要 从 工 
AR 中 作出 选择 ,如 果 参 与 者 1 选择 工 ,其 后 就 到 达 参 与 者 2 的 一 个 决策 
节 , 这 时 2 要 从 LAR 中 选择 行动 。 类 似 地 , 如 果 参 与 者 1 选择 R, 则 将 到 
达 参 与 者 2 的 另 一 个 决策 节 , 这 时 2 从 工 -和 R' 中 选择 行动 。 无 论 2 选择 了 
哪 一 个 , 都 将 到 达 终 点 节 (terminal node)( 即 博弈 结束 ) 县 两 参与 者 分 别 得 
到 相应 终点 节 下 面 的 收益 。 

用 类 似 的 方法 可 将 图 2.4.1 的 博弈 树 进行 扩展 , 用 来 表示 所 有 完全 且 
完美 信息 动态 博弈 一 即 任何 参与 者 炭 序 行动 .对 下 一 行动 作出 选择 之 前 
其 前 面 所 有 行动 都 是 共同 知识 , 并 且 每 一 可 能 的 行动 组 合 下 各 参与 者 的 收 
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益 也 是 共同 知识 的 博弈 。 (如 斯 塔 克 尔 中里 模型 中 行动 空间 连续 的 情况 ,或 
FM UP PFT Bh E FO A A OR, EREE RRIT ERE, 但 从 概 
念 上 讲 却 没有 任何 障碍 -) 此 后 我 们 将 导出 图 2.4.1 所 示 动 态 博弈 的 标准 式 
表述 , 并 在 本 节 的 最 后 证 明 静 态 博 弈 也 可 以 给 出 扩展 式 表 述 . 并 介绍 如 何 构 
建 完全 非 完美 信息 动态 博 穿 的 扩展 式 表 述 。 

正如 在 对 标准 式 和 扩展 式 定义 中 的 序号 所 代表 的 ,标准 式 定义 中 “一 个 
参与 者 可 行 的 战略 ”第 二 条 ) 与 扩展 式 定义 中 “一 个 参与 者 何 时 行动 、 他 可 
以 如 何 行动 及 他 了 解 秆 么 信息 "{ 第 2a、25 和 2c 条 ), 有 着 非常 密切 的 关 
系 。 为 把 一 个 动态 博弈 表示 为 标准 式 , 我 们 需 把 扩展 式 中 的 信息 转换 为 对 
标准 式 中 每 一 参与 者 战略 空间 的 措 述 。 为 做 到 这 一 点 ,回顾 第 2.3.B 节 给 
出 的 “战略 "的 ( 非 正 式 ) 定 义 ， 


定义 ”参与 者 的 一 个 战略 是 关于 行动 的 一 个 完整 计划 一 一 它 明确 了 在 
参与 者 可 能 会 遇 到 的 每 一 种 情况 下 对 可 行 行动 的 选择 。 


要 求 参与 者 的 一 个 战略 明确 该 参与 者 可 能 会 遇 到 的 每 一 种 情况 下 的 行 
动 选择 ,看 起 来 似乎 是 不 必要 的 。 不 过 ,很 快 我 们 将 会 看 到 , 如 果 允 许 参与 
者 的 一 个 战略 中 没有 明确 某 些 情况 下 该 参与 者 的 行动 , 我 们 将 无 法 在 完全 
信息 动态 博弈 中 使 用 纳什 均衡 概念 。 在 参与 者 ; 计算 针对 参与 者 的 战略 
的 最 优 反 应 时 ,j 需要 考虑 在 每 一 种 情况 下 i 将 如 何 行动 ,而 并 非 仅 考虑 在 
i Rj 认为 最 有 可 能 发 生 的 情况 下 对 方 的 行动 。 

在 图 2.4.1 的 博弈 中 , 参与 者 2 有 两 个 行动 , 却 有 4 个 战略 ;因为 还 存 
在 着 两 种 不 同 的 情况 (具体 地 说 , 分 别 是 观测 到 参与 者 1 选择 工 和 观测 到 
参与 者 1 选择 R 后 的 情况 ), 参与 者 2 将 可 能 在 这 两 种 情况 下 进行 选择 : 

战略 1; 如 果 参 与 者 1 选择 工 , 则 选择 L , 如 果 参 与 者 1 选择 R, 则 选择 

L’, 表示 为 ( 工 , 卫 ); 

战略 2; 如 果 参 与 者 1 选择 工 , 则 选择 L, 如 果 参 与 者 1 AE R, MAE 

RR ACL’, RR’); 

战略 3: 如 果 参 与 者 1 选择 L, 则 选择 R, 如 果 参 与 者 1 RR, 则 选 

L ERAR, R); 

战略 4: 如 果 参 与 者 ! 选择 L, 则 选择 R, 如果 参与 者 1 选择 R. M 

ER’, RR WCR’, R Jo 
不 过 对 参与 者 1 来 讲 , 有 两 个 行动 但 同时 也 只 有 两 个 战略 :选择 L 和 选择 
Ro 参与 者 1 之 所 以 只 有 两 个 成 略 , 是 因为 参与 者 1 行动 时 只 有 可 能 面临 
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一 种 情况 (具体 地 说 ,就 是 在 铺 弈 的 一 开始 , 这 时 自然 由 参与 者 1 行动 ), 于 
是 参与 者 1 的 战略 空间 与 其 行动 空间 是 相同 的 , 即 ASIL, Rio 
给 出 两 参与 者 的 战略 空间 后 ,从 博弈 的 扩展 式 表 述 导 出 其 标准 式 表 述 
就 十 分 简单 了 。 用 标准 式 表 述 中 的 行 表示 参与 者 1 的 可 行 战略 .列表 示 参 
与 者 2 的 可 行 战略 , 并 计算 参与 者 每 一 可 能 的 战略 组 合 下 每 人 的 收益 ,如 图 
2.4.2 所 示 。 
参与 者 2 


EE) (ER) (R'E) (RR) 


3,1 Bl 
21 0,0 


1,2 
2,1 


1,2 
0.0 


参与 者 1 


2.4.2 


现在 我 们 已 证 明 一 个 动态 博弈 可 以 表示 为 标准 式 , 下 面 我 们 反 过 来 说 
明 一 个 静态 ( 即 同 时 行动 ) 博 弈 如 何 用 扩展 式 表述 。 要 做 到 这 一 点 ,我 们 要 
运用 第 1.1.A 节 与 办 徒 困境 相关 的 一 个 观察 结果 , 静态 博弈 中 参与 者 不 
一 定 要 同时 行动 :每 个 参与 者 在 选择 战略 时 不 知道 其 他 参与 者 的 选择 就 
是 够 了 。 正 如 囚徒 困境 中 分 开关 押 的 囚犯 可 以 在 任何 时 间作 出 他 们 的 
决策 。 从 而 我 们 可 以 把 (所 谓 的 ) 参 与 者 1 和 2 之 辣 的 同时 行动 博弈 表 
示 如 下 : 

1. 参 与 者 1 从 可 行 集中 选择 行动 ai; 

2. 参 与 者 2 没有 观测 到 参与 者 1 的 行动 , 并 从 可 行 集中 选择 行动 a2; 

3. 两 参与 者 的 收益 分 别 为 (ay, az) 和 w2(ats42)。 
或 换 一 种 顺序 ,参与 者 2 可 以 首先 行动 , 接着 参与 者 1 在 没有 观测 到 参与 者 
2 行动 的 情况 下 行动 。 回 顾 我 们 在 第 2.1.B 节 介绍 的 斯 塔 克 尔 贝 里 博弈 ， 
企业 2 在 行动 之 前 观测 到 企业 1 的 产量 ， 当 人 时 还 提 到 一 个 与 之 时 序 完全 相 
同 ， 但 信息 结构 却 不 同 的 情况 ， 那 里 我 们 证 明 ， 在 这 一 序 贯 行动 ， 并 不 能 
观测 到 其 他 参与 者 行动 的 博弈 中 ， 有 着 和 同时 行动 的 古 诺 博 弈 相同 的 纳什 
均衡 。 

为 在 博弈 的 扩展 式 中 表示 此 类 不 知道 以 前 行动 的 情况 , 我 们 引入 一 个 
新 的 往 念 一 一 参与 者 的 信息 集 (information set); 


定义 ”参与 者 的 一 个 信息 集 指 满足 以 下 条 件 的 决策 节 的 集合 : 
(9 在 此 信息 集中 的 每 一 个 节 都 轮 到 该 参与 者 行动 , 且 
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《ii) 当 博弈 的 进行 达到 信息 集中 的 一 个 结 ,应 该 行动 的 参与 者 并 不 知道 
达到 了 (或 没有 达到 ) 信 息 集 中 的 哪 一 个 节 。 


这 一 定义 的 第 { 订 部 分 意味 着 参与 者 在 一 个 信息 集中 的 每 一 个 决策 节 都 有 
着 相间 的 可 行 行动 集合 , 否则 该 参与 者 就 可 通过 他 面临 的 不 同 的 可 行 行动 
集 来 推断 到 达 了 (或 没有 到 达 ) 某 些 节 。 


Bite 1 


2.4.3 


在 一 个 扩展 式 博弈 中 , 为 表示 某 些 决策 节 处 于 同一 信息 集中 , RTE 
线 把 这 些 决 策 节 连 起 来 , 如 图 2.4.3 给 出 的 囚徒 困境 的 扩展 式 表 述 。 有 时 我 
们 在 同一 信息 集中 每 个 决策 节 旁 边 注 明 轮 到 哪 一 个 参与 者 行动 , 如 图 
2.4.3 所 示 ; 有 时 我 们 只 是 在 连接 这 些 节 的 虚线 上 注 明 轮 到 哪 一 参与 者 行 
动 ,如 图 2.4.4 所 示 。 图 2.4.3 中 , 囚徒 2 的 信息 集 表 示 在 轮 到 囚徒 2 行动 
时 , 他 只 知道 到 达 了 这 一 信息 集 ( 即 办 徒 已 经 行动 过 了 ), 但 是 并 不 清楚 到 
达 了 哪 一 个 节 ( 即 囚徒 1 是 如 何 行动 的 )。 在 第 4 章 中 我 们 将 讲 到 囚徒 2 会 
对 囚徒 1 的 行动 持 有 一 个 猜测 或 推断 , 即使 他 并 不 能 观察 到 前 者 的 行动 ,但 
目前 我 们 暂时 不 考虑 这 一 因素 。 

作为 运用 信息 集 表 示 不 了 解 前 面 行 动 的 第 二 个 例子 ,考虑 下 面 的 完全 
非 完美 信息 动态 博 蛮 ; 

1. 参 与 者 1 从 可 行 集 A = IL, R1 中 选择 行动 a 

2. 参 与 者 2 观测 到 a1, 然后 从 可 行 集 Az = IL, R'| 中 选择 行动 a2; 

3. 参 与 者 3 观测 是 否 (a4, az) = (R,R'), 然 后 从 可 行 集 As = IL", R 
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中 选择 行动 a3。 


图 2.4.4 


这 一 博弈 的 扩展 式 表述 (为 简化 起 见 , 略 去 每 个 参与 者 的 相应 收益 ?如 
图 2.4.4 所 给 出 。 在 扩展 式 中 ,参与 者 3 有 两 个 信息 集 : 如 果 1 选择 R, 2 
WER, 参与 者 3 进入 只 有 一 个 决策 节 的 信息 集 , 此 种 情况 之 外 轮 到 3 行 
动 时 , 则 他 进入 包含 其 余 所 有 决策 节 的 信息 集 。 从 而 ,参与 者 3 所 能 够 观测 
到 的 只 是 (a1, az) 是 否 等 于 (只 , R Jo 

在 引入 了 信息 集 的 概念 之 后 , 我 们 可 以 给 出 区 分 完美 信息 和 非 完美 信 
息 的 另外 一 种 定义 。 前 面 我 们 曾 将 完美 信息 定义 为 在 博弈 的 每 一 步行 动 
中 , 轮 到 行动 的 参与 者 了 解 前 面 博弈 进行 的 全 部 过 程 - 对 完美 信息 的 一 个 
等 价 的 定义 是 每 一 个 信息 集 都 是 单 节 的 ;相反 , 非 完 美 信息 则 意味 着 至 
少 存在 一 个 非 单 节 的 信息 集 ?。 那 么 , 一 个 同时 行动 博弈 (如 囚徒 困境 ) 
的 扩展 式 表 述 就 是 一 个 非 完美 信息 博弈 。 同 理 , 第 2.2.A 节 讨 论 的 两 
阶段 博 穿 也 是 非 完美 信息 的 ,因为 参与 者 1 和 2 的 行动 是 同时 的 ,参与 
者 3 和 4 的 行动 也 是 同时 的 。 更 为 一 般 地 , 一 个 完全 但 非 完美 信息 动态 
博 蛮 可 用 含有 非 单 节 信 息 集 的 扩展 式 表 示 , 从 而 可 以 看 出 每 一 参与 者 在 
轮 到 他 行动 时 , 知道 (以 及 不 知道 ) 什 么 ,这 一 点 ,图 2.4.4 已 给 出 一 个 
例子 。 


2.4.B 子 博弈 精炼 纳什 均衡 
第 2.3.B 节 给 出 了 子 博弈 精炼 纳什 均衡 的 一 般 性 定义 。 但 当时 我 们 
O RPL GAG GRETA NER LN HEARERS A, 因为 


第 4 覃 将 会 讲 到 , TROPAST SAH CARRS AEP PH EM, 不 过 , 在 本 章 中 , 我 
们 只 讨论 完全 信息 的 博 况 。 
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只 把 这 一 定义 用 于 重复 博弈 , 因为 我 们 只 针对 重复 博弈 定义 了 战略 和 子 博 
弈 的 概念 。 在 第 2.4.A 节 我 们 给 出 了 战略 这 一 概念 的 一 般 性 定 文 .现在 再 
给 出 子 博弈 的 一 般 性 定义 , 其 后 就 可 以 把 子 博弈 精炼 纳什 均衡 的 概念 应 用 
于 一 般 的 完全 信息 动态 博弈 了 。 

回顾 第 2.3.B 节 我 们 曾 给 出 的 子 博弈 的 非 正式 定义 , 即 从 博弈 进行 到 
的 某 一 点 开始 ,前 面 整个 博弈 的 进行 过 程 在 所 有 参与 者 中 都 是 共同 知识 , 始 
于 该 点 的 其 余部 分 的 博弈 就 是 原 博弈 的 一 个 于 博弈, 并 针对 重复 博弈 给 出 
了 子 博 弈 的 正式 定义 。 下 面 我 们 对 用 扩 麻 式 表述 的 一 般 完全 信息 动态 博弈 
给 出 子 博弈 的 正式 定义 。 


定义 扩展 式 博弈 中 的 子 博弈 

(a) 始 手 单 节 信 息 集 的 决策 节 = (但 不 包括 博弈 的 第 一 个 决策 节 ); 

(b) 包 含 博弈 树 中 n 之 下 所 有 的 决策 节 和 终点 节 ( 但 不 在 n 下 面 的 除 
外 )s 

(c) 没 有 对 任何 信息 集 形成 分 割 。( 即 如 果 博 弈 树 中 nn 之 下 有 一 个 决 
SAE no", MUD = 处 于 同一 信息 集 的 其 他 决策 节 也 必须 在 =*,. 之 下 ,从 
而 也 必须 包含 于 子 博 弈 中 。》 


定义 中 , (a) 的 附注 说 明了 我 们 不 把 整个 博弈 看 成 一 个 子 博弈 , 但 这 只 是 一 
个 习惯 问题 :把 定义 中 的 括号 除去 对 我 们 以 后 的 分 析 不 会 产生 任何 影响 。 

我 们 可 以 利用 图 2.4.1 和 图 2.4.3 的 因 徒 困境 说 明定 义 中 的 前 两 部 分 
(a) 和 (b)。 图 2.4.1 中 ,存在 两 个 子 博弈 ,分 别 始 于 参与 者 2 的 两 个 决策 
节 。 在 因 徒 困境 (或 其 他 任何 同时 行动 博弈 ) 中 不 存在 子 博弈 。 为 说 明定 义 
的 最 后 部 分 (ec), 考虑 图 2.4.4 给 出 的 博弈, 该 博弈 只 有 一 个 子 博弈 , 它 始 于 
参与 者 1 选择 R BSH 2H R' 之 后 参与 者 3 的 决策 节 。 由 于 (c) 的 限 
制 ,参与 者 2 的 两 个 决策 节 之 下 都 不 能 构成 一 个 子 博 弈 , 即使 这 两 个 决策 节 
都 处 于 单 节 的 信息 集 。 

之 所 以 在 定义 中 要 加 上 (e) 的 限制 ,是 因为 我 们 希望 能 够 把 子 博 弈 当成 
一 个 独立 的 搏弈 进行 分 析 , 并 且 分 析 的 结果 能 用 于 原 博 弈 。 在 图 2.4.4 P, 
如 果 我 们 试 着 把 参与 者 1 选择 L 之 后 参与 者 2 的 决策 节 看 成 一 个 于 博 蛮 
的 起 点 , 事实 上 我 们 是 制造 了 一 个 子 博 蛮 , 其 中 参与 者 3 不 知道 参与 者 2 的 
行动 ,但 却 知道 参与 者 1 的 行动 。 对 这 样 一 个 子 博 弈 的 分 析 与 原 博 弈 就 不 
存在 相关 性 , 因为 在 原 博弈 中 参与 者 3 并 不 知道 1 的 行动 ,而 只 能 观测 到 
(a1s az) 是 否 等 于 (R, R')。 请 回顾 在 讨论 重复 博弈 时 相似 的 论证 , 即 第 z 
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阶段 的 阶段 博弈 (有 限 重 复 时 *< T) 本 身 并 不 是 重复 博弈 的 一 个 子 博 弈 。 

对 (c) 必 要 性 的 另 一 种 理解 , 是 (a) 只 保证 了 在 决策 节 n 应 该 行动 的 参 
与 者 知道 博弈 到 此 为 止 的 整个 进行 过 程 , 而 不 能 保证 其 他 参与 者 也 知道 这 
一 过 程 , (c) 则 保证 了 博弈 到 该 点 为 止 的 整个 过 程 在 所 有 参与 者 中 是 共同 知 
R, 原因 如 下 :在 = Ze ES, 比如 n, E n 应 该 行动 的 参与 者 知道 博 
弈 到 达 了 决策 节 #=, 从 而 即使 = 处 于 非 单 节 的 信息 集 , 由 于 在 该 信息 集中 的 
TAP RE n 之 下 , 在 该 信息 集 行动 的 参与 者 就 知道 博弈 已 经 到 达 了 n 下 
面 的 某 个 决策 节 。( 如 果 认 为 后 面 的 叙述 有 些 抛 口 ,部 分 因为 博弈 的 标准 式 
表述 只 明确 了 在 参与 者 i 的 每 一 个 决策 节 ; 知道 的 信息 ,而 并 没有 明 克 指 
出 在 7 的 决策 节 ; 知道 的 信息 。) 前 面 已 讲 过 ,图 2.4.4 就 提供 了 不 符合 (c) 
的 一 个 例子 。 现 在 ,我 们 可 以 重新 解释 这 个 例子 , 如 果 我 们 ( 非 正式 地 ) 分 析 
一 下 在 参与 者 1 选择 上 之 后 参与 者 2 的 决策 节 上 参与 者 3 知道 的 信息 ,就 
会 发 现 3 并 不 知道 博弈 到 该 点 为 止 的 全 部 进行 过 程 ,因为 在 其 后 3 的 决策 
PP, 他 并 不 知道 1 是 选择 了 上 还 是 选择 了 R。 

在 给 出 子 博 穿 的 一 般 定义 之 后 , 我们 就 可 以 使 用 第 2.3.B 节 给 出 的 子 
博弈 精炼 纳什 均衡 的 定义 了 ， 


定义 ( 塞 尔 滕 ,1965) ”如 果 参 与 者 的 战略 在 每 一 个 子 博弈 中 都 构成 了 
纳什 均衡 , 则 称 纳 慎 均衡 是 子 博弈 精炼 的 。 


任何 有 限 的 完全 信息 动态 博弈 ( 即 任何 参与 者 有 限 、 每 一 参与 者 的 可 行 
战略 集 有 限 的 博弈 ) 都 存在 子 博 讲 精 炼 纳什 均衡 , 也 许 包 含混 合 战略 。 这 一 
结论 的 证 明 思 路 非常 简单 , 即 根据 逆向 归纳 的 原理 ,构建 出 子 博弈 精 冻 纳什 
均衡 , 并 基于 下 面 两 个 观察 结论 。 第 一 ,尽管 纳什 定理 是 在 完全 信息 静态 博 
弈 的 条 件 下 给 出 的 , 它 适用 于 任何 有 限 的 完全 信息 的 标准 式 博弈 , 并 且 我 们 
已 经 证 明 此 类 博弈 既 可 以 是 静态 的 ,又 可 以 是 动态 的 。 第 二 ,一 个 有 限 的 完 
全 信息 动态 博弈 的 子 博弈 数 也 是 有 限 的 , 而 每 个 子 博 守 都 满足 纳什 定理 的 
BE. 


O AVE—T FEATS, Be AER PTA -h TE 
(如 果 一 个 子 博弈 不 再 包含 其 他 任何 子 博弈 , RFE hd). RE, 用 这 些 子 博弈 的 一 个 纳 
‘Ph UAB RE TE DEBE PS A eG EE, FEO AEF ED Be a a i 
LAT LCE A A TERATE, FF ASSES AS TE ST AR 
些 子 博弈 。 用 此 方法 从 树 的 最 未 端 逆 推 就 可 得 到 一 个 子 博弈 精炼 纳什 均衡 , 因为 参与 者 的 战略 在 
每 一 个 子 博 讲 中 都 构 成 了 纳什 均 瞻 (事实 上 , TETERA) 
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我 们 已 介绍 过 与 子 博 蛮 精 炼 纳什 均衡 密切 相关 的 两 个 概念 :第 2.1.A 
节 定 义 的 逆向 归纳 解 和 第 2.2.A 节 定 义 的 子 博弈 精炼 解 。 不 太 正 式 地 讲 ， 
区 别 在 于 一 个 均衡 是 战略 的 集合 { 战 略 又 是 关于 行动 的 完全 的 计划 ) ,而 
一 个 解 则 只 对 期 望 将 要 发 生 的 情况 给 出 相应 的 行动 及 结果 , 而 不 是 针对 所 
有 可 能 发 生 的 情况 。 要 进一步 精确 界定 “均衡 "和 “ 解 * 的 区 别 , 并 更 好 地 说 
骨 子 博弈 精炼 纳什 均衡 的 概念 ,现在 我 们 重新 考虑 第 2.1.A 节 和 第 2.2.A 
节 定 义 的 博弈 。 


# 


EX ER21APENMHSHES ABA BRET, 地 向 归纳 
解 为 (ar , Rlar )), 但 子 博弈 精炼 纳什 均衡 为 (a? , R2(a1))。 


在 这 样 的 博弈 中 ,行动 ay 即 为 参与 者 ! 的 一 个 战略 ,因为 参与 者 工 只 
可 能 在 一 种 情况 下 选择 行动 一 一 即 在 博弈 刚 开 始 , 不 过 对 参与 者 2, Ra 
Cap ) 却 只 是 一 个 行动 (具体 地 说 ,是 对 a? 的 最 优 芭 应 ), 而 并 非 一 个 战略 、 
因为 参与 者 2 的 一 个 战略 必须 包含 针对 1 在 第 一 阶段 每 个 可 能 的 行动 , 参 
与 者 2 将 采取 的 行动 。 从 而 , 参与 者 2 的 最 优 反 应 函数 Rs(a1) 是 其 一 个 战 
略 。 在 此 类 博弈 中 , 子 博弈 始 于 (并 只 包含 ) 参 与 者 2 在 第 二 阶段 的 行动 。 
对 参与 者 1 的 每 一 个 可 能 行动 a 属于 AL, 都 存在 一 个 子 博 弈 ， 从 而 为 证 
明 (ar , Rz(ai)) 是 一 个 子 博弈 精炼 纳什 均衡 ， 我 们 必须 证 明 (er , R 
(a1)) 是 一 个 纳什 均衡 ， 并 且 参 与 者 的 战略 在 每 一 个 子 博弈 中 都 构成 一 个 
纳什 均衡 。 由 于 子 博弈 都 只 是 单 人 决策 问题 ， 后 一 问题 就 可 简单 化 为 要 求 
参与 者 2 的 行动 在 每 一 子 博弈 中 都 是 最 优 的 ， 它 又 正 是 参与 者 2 的 最 优 反 
应 函数 Rz(ali) 所 解决 的 阿 题 。 最 后 , (a? ,Ra(et) 是 一 个 纳什 均衡 , 因为 
参与 者 的 战略 互 为 最 优 反应 :a “是 Raz(ai) 的 最 忧 反应 , 即 ar 令 wui(CalR2 
《ai)) 最 大 化 ,并 且 RzCai) 为 .a "的 最 优 反 应 , 即 Rar} uzlat, az) 最 
大 化 。 、 

对 第 2.2.A 节 分 析 的 博弈 , 其 论证 过 程 是 相似 的 ,所 以 我 们 只 进行 简 
要 的 讨论 。 


定义 在 第 2.2,A 节 定义 的 完全 非 完美 信息 两 阶段 博弈 中 , 子 博弈 精 
炼 解 为 (ar , a7 ,a3 (ar oz) az(ar.ez)), 但 子 博弈 精炼 纳什 均衡 为 


(af ,a2 sas, Cat, a? hag (ar, a7 ))o 
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在 这 一 博弈 中 ,行动 组 合 (a3 , (af , a? hag larar )) 只 是 参与 者 3 
和 4 之 间 一 个 子 博弈 的 纳什 均衡 ,具体 地 说 , 是 参与 者 1 和 2 选 定 战略 
(af ,a2 ) 后 其 余部 分 的 博 蛮 ) 而 (ed larar) af (au a2)) 却 分 别 为 参与 
者 3 和 参与 者 4 的 一 个 战略 一 针对 参与 者 1 和 2 每 一 可 能 行动 组 合作 出 
有 反应 的 完整 行动 计划 。 在 这 一 博弈 中 , 子 博 弈 是 在 给 定 参与 者 1 和 2 在 第 
一 阶段 的 行动 后 ,第 二 价 段 参与 者 3 和 4 之 问 的 博弈 , 正如 子 博 弈 精炼 纳什 
均衡 所 要 求 的 ,战略 组 合 (a3 (a1, a2), ag (ay, ap) ER — TP FR PRB 
成 了 纳什 均衡 。 

为 总 结 本 节 ( 以 及 本 章 ) 的 内 雁 , 我 们 用 下 面 的 例子 说 明 本 章 的 主要 思 
想 : 子 博弈 精炼 绚 除 了 基于 不 可 统 信 的 威胁 或 承诺 之 上 的 纳什 的 衡 。 请 回 
顾 图 2.4.1 中 的 扩展 式 博 弈 , 如 果 我 们 在 第 2.1.A 节 遇 到 这 一 博弈 , 我 们 
就 会 用 北向 归纳 法 求解 如 下 。 如 果 参 与 者 2 到 达 参 与 者 1 选择 工 之 后 的 
决策 节 , 则 2 的 最 优 反应 为 选择 R“( 可 得 到 的 收益 为 2), 而 不 是 选择 工 《 只 
能 得 到 1 的 收益 )。 如 果 2 到 达 参 与 者 1 WH R 之 下 的 决策 节 , 则 2 的 最 
优 反应 为 选择 L“( 可 获得 的 收益 为 1), 而 不 是 R“( 可 得 到 的 效益 为 0)。 由 
于 参与 者 1 能 和 参与 者 2 一 样 解 出 2 的 最 优选 择 ,1 在 第 一 阶段 的 问题 就 
可 归结 为 在 L( 将 会 令 参与 者 2 选择 R, 从 而 使 1 的 收益 为 1) 和 ROS 
使 参与 者 2 选择 工 , 从 而 使 1 的 收益 为 2) 之 间 进 行 选择 。 从 而 , 参与 者 1 
对 预期 的 2 的 行动 的 最 优 反应 是 在 第 一 阶段 选择 尺 ,于 是 博弈 的 逆向 归纳 
ACR, L), 如 在 图 2.4.5 中 用 粗 线 表示 出 的 始 于 参与 者 1 决策 节 的 路 
B. 图 中 另外 还 有 一 条 粗 线 始 自 参 与 者 EL 之 后 的 参与 者 2 的 决策 
节 , 博 弈 树 中 的 这 种 不 完全 路 径 表 明 , 如 果 博 穿 到 达 参 与 者 2 的 这 一 决策 
节 , 参与 者 2 将 会 选择 R'。 

我 们 已 讲 过 ,同一 博 穿 的 标准 式 表述 由 图 2.4.2 给 出 。 如 果 我 们 在 第 
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1.1.C 节 中 遇 到 这 么 一 个 标准 式 博 弈 , 我 们 将 会 解 出 其 ( 纯 战 略 ) 纳 什 均 衡 ， 
它们 为 (R,(R’ ,LL )) 和 ( 工 ，(R 玉 '))。 下 面 我 们 来 比较 从 图 2.4.2 中 解 
出 的 这 两 个 纳什 均衡 与 图 2.4.5 中 根据 扩展 式 道 向 归纳 法 导出 的 结果 : 标 
准 式 表述 中 的 纳什 均衡 (R, CR’,L')) 对 应 了 图 2.4.5 中 的 所 有 粗 线路 径 。 
在 第 2.1.A 节 我 们 称 (R, LL ) 为 博弈 的 道 向 归纳 解 , 因此 也 可 以 十 分 自然 
地 称 (R,《R ,上 L')) 为 博弈 的 逆向 归纳 纳什 均衡 ,但 我 们 用 较为 专业 性 的 名 
尊称 之 为 子 博弈 精炼 纳什 均衡 。 一 个 解 和 一 个 均衡 的 区 别 , 在 于 解 特 指 始 
于 博弈 的 第 一 个 决策 节 并 终于 终点 节 的 惟一 的 粗 线路 径 , 而 均衡 同时 还 包 
含 了 另外 的 始 自 1 选择 工 之 后 2 的 决策 节 的 粗 体 线路 径 , 这 也 就 是 说 , 均 
衡 包 含 了 参与 者 2 的 一 个 完整 的 战略 。 

但 另 一 个 纳什 均衡 (R,(R',L')) 又 有 什么 特点 呢 ? 在 这 一 均衡 中 , 参 
与 者 2 的 战略 是 不 仅 在 参与 者 1 选择 L 时 选择 R'( 这 一 条 和 第 一 个 纳什 均 
SRAM), 而 且 当 参与 者 1 选择 R 时 仍 选择 R'。 因 为 (在 R 之 后 的 )R” 
将 使 参与 者 1 的 收益 为 0, 参与 者 1 对 参与 者 2 这 一 战略 的 最 优 反 应 将 是 
选择 工 , 以 使 参与 者 1 的 收益 达到 1( 在 参与 者 2 选择 RR 之 后 ), 至 少 优 于 一 
无 所 获 。 用 不 太 严格 却 更 为 形象 的 话 讲 , 我 们 可 以 说 参与 者 2 威胁 如 果 参 
与 者 1 选择 RR, 他 将 选择 R'( 严 格 地 讲 , 在 1 选择 行动 之 前 ,2 并 没有 机 会 
作出 这 一 威胁 ,如 果 有 , 它 将 已 经 包含 在 扩展 式 之 中 了 }。 如 果 这 一 威胁 起 
作用 了 ( 即 1 选择 了 工 ) 则 2 就 没有 机 会 实践 他 的 威胁 ,不 过 这 一 威胁 也 不 
会 起 作用 ,因为 它 是 不 可 信 的 :如 果 参 与 者 2 被 给 予 机 会 实施 他 的 威胁 ( 即 
WR 1 的 确 选 择 了 R) 则 参与 者 2 将 会 决定 选择 L, 而 不 会 是 R'。 更 正 
式 一 点 儿 说 , WEL, (R, R TETRA KH, 因为 参与 者 的 战 
BERTH TTR PE A RAT. Atm, 参与 者 2 的 选择 
R’“ 在 始 自 (并 完全 由 其 组 成 ) 参 与 者 1 选择 R 之 后 参与 者 2 的 决策 节 的 于 
博弈 中 不 是 最 优 的 。 

在 一 个 完全 且 完 美 信 息 博弈 中 , ie AAA T ERA Te F 
每 一 个 信息 集 都 是 单 节 的 ,博弈 树 上 每 个 决策 节 都 分 别 代表 了 参与 者 可 能 
会 遇 到 ,并 需 作 出 反应 的 情况 。 从 而 在 扩展 式 中 , 通过 每 个 决策 节 逐 级 逆向 
妇 纳 求解 的 程序 ,也 就 可 以 看 成 迫使 每 个 参与 者 考虑 实施 他 可 能 作出 的 每 
一 个 威胁 。 人 也是 ,在 一 个 非 完 美 信息 博弈 中 , 问题 就 不 那么 简单 了 ,因为 这 
种 博弈 包含 了 至 少 一 个 非 单 节 的 信息 集 。 我 们 也 可 以 试 着 用 相同 的 方法 ， 
在 扩展 式 中 通过 道 推 求解 , 总 是 会 到 达 某 个 处 于 非 单 节 信 息 集 内 的 决策 节 。 
但 如 果 博 弈 真 的 到 达 了 这 个 决策 节 , 强迫 参与 者 考虑 如 何 行动 , 并 不 等 于 让 
其 考虑 在 一 个 可 能 发 生 的 情况 下 他 将 如 何 行动 ,因为 如 果 博 弈 真 的 进行 到 
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了 这 个 信息 集 , 应 该 行动 的 参与 者 并 无 法 知道 是 否 到 达 了 这 个 决策 节 , 正 是 
由 于 此 决策 节 包含 在 一 个 非 单 节 的 信息 集中 。 

在 道 向 归纳 法 中 , 解决 由 非 单 节 信息 集 引 起 的 问题 的 方法 之 一 ,是 在 扩 
展 式 中 从 后 往 前 道 推 求 解 , 直到 遇 到 一 个 非 单 节 信息 集 ,. 先 暂 时 不 要 管 它 ， 
径直 越过 该 信息 集 向 上 , 直到 到 达 一 个 单 节 信 息 集 。 然 后 ,不仅 要 考虑 在 这 
个 单 节 信息 集 行动 的 参与 者 在 到 达 此 决策 节 时 如 何 选 择 ,还 要 同时 分 析 在 
刚刚 被 越过 的 非 单 节 信息 集 行动 的 参与 者 将 会 如 何 选 择 。 一 般 来 说 ,这 一 
程序 最 后 可 得 到 子 博弈 精炼 绑 什 均衡 。 解 决 上 述 问题 的 另 一 种 方法 ,是 先 
在 扩展 式 中 运用 北向 归纳 的 方法 , 直到 遇 上 了 一 个 非 单 节 信息 集 , 然后 强迫 
在 该 信息 集 行动 的 参与 者 考虑 如 果 到 达 了 这 一 信息 集 将 如 何 选择 (要 做 到 
这 一 点 ， 必 须要 求 该 参与 者 对 到 达 了 同一 信息 集中 哪 一 个 决策 节 有 一 个 概 
率 上 的 判断 。 这 样 的 判断 当然 又 要 依赖 于 各 参与 者 在 博弈 树 的 更 上 方 可 能 
的 行动 ， 所 以 ， 运 用 这 一 方法 ， 只 对 博弈 树 从 下 往 上 逆 推 一 遍 是 无 法 得 到 
结果 的 )。 一 般 而 言 ， 这 一 程序 可 以 得 到 一 个 精炼 贝 叶 斯 均衡 ， 参 见 第 4 
章 。 


2.5 进一步 阅读 


BAT 关于 没有 工会 组 织 企业 的 工资 和 就 业 , SIH REM 
里 (1989, 习题 2.10) 给 出 的 重复 谈判 模型 , UA Be BEA (Staiger, 1991) 给 出 
的 单一 谈判 模型 ,其 中 企业 可 以 选择 是 就 工资 和 就 业 同 时 谈判 还 是 只 就 工 
资 进行 谈判 。 关 于 序 贯 谈判 ,参见 费尔南德斯 和 格 莱 泽 (Fernandez & Glaz- 
er, 1991) 给 出 的 企业 和 工会 间 讨 价 还 价 的 鲁 宾 斯 坦 式 模型 , 在原 模 型 的 基 
础 上 又 增加 了 新 的 特点 , 即 工会 必须 决定 如 果 要 价 被 任何 一 方 拒绝 ,是否 要 
继续 进行 罢工 , 这 种 条 件 下 存在 多 个 有 效率 的 子 博弈 精炼 均衡 ,同时 又 支持 
无 效率 的 均衡 ( 即 含 有 罢工 的 均衡 ), 即使 信息 是 完全 的 。 奥 斯 本 (COsborne》 
MERRE (1990) 的 专著 里 概括 总 结 了 许多 博弈 理论 的 讨价还价 模型 , 并 
将 它们 与 纳什 关于 讨价还价 的 公 青 式 方法 相 联系 ,并 把 讨价还价 模型 看 成 
是 市 场 理论 的 基石 之 一 。 

第 2.2 节 关于 银行 挤 提 . 参 见 杰 克 林 和 巴 塔 查 里 亚 (Jacklin & Bhat- 
tacharya, 1988). ÆW 2KfE( McMillan, 1986) 的 著作 中 概括 分 析 了 博弈 论 在 
国际 经 济 学 领域 的 早期 应 用 :参见 布 龙 和 罗 戈 夫 (Buion & Rogoff, 1989) 关 
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于 债务 危机 的 最 新 研究 成 果 。 关 于 工作 竞赛 , 参见 拉 齐 尔 (1989, 习题 2.8) 
的 模型 ,其 中 工人 既 可 以 提高 自己 的 产量 , 同时 又 可 以 搞 破坏 ,降低 他 人 的 
产量 ; 罗 森 (1986) 讨 论 了 一 系列 工作 竞赛 的 情况 ,其 中 一 个 回合 的 失败 者 将 
不 再 参加 以 下 回合 的 竞赛 , 并 求 得 为 维持 激励 而 必须 的 代价 。 

第 2.3 节 员 努 瓦 和 克 里 希 纳 (1985) 分 析 了 有 限 重 复 博弈 。 关 于 重 
新 谈判 ,参见 贝 努 现 和 克 里 希 纳 (1989) 对 有 限 重复 博弈 的 讨论 , 以 及 法 雷 
尔 和 马 斯 金 (1989) 对 无 限 重 复 博弈 的 分 析 和 对 有 关 文 献 的 综述 。 泰 勒 尔 
(1988, 第 6 章 ) 总 述 了 动态 的 骞 头 芍 断 模型 。 阿 克 尔 洛 夫 和 时 林 (Akerlof 
& Yellen ,1986) 的 论文 集 收集 了 关于 效率 工资 方面 的 许多 重要 论文 , 并 所 
供 了 一 个 整 体 上 的 介绍 。 关 于 货币 政策 , 印 尔 (Ball , 1990) 对 现存 的 不 同 风 
格 横 型 的 前 提 及 分 析 做 了 回顾 和 总 结 , 并 给 出 了 一 个 解释 通货 膨胀 时 间 路 
径 的 模型 。 

第 2.4 节 克 雷 普 斯 和 威尔逊 (1982) 关 于 博弈 扩展 式 的 正式 分 析 ; 克 
雷 普 斯 (1990) 还 给 出 了 更 容易 理解 的 文字 表述 。 


2.6 习题 


第 2.1 节 

2.1 本 题 取 自 首先 由 贝克 尔 (Becker, 1974) 提 出 并 分 析 的 一 个 模型 。 
假设 一 个 家 长 和 他 的 孩子 进行 如 下 的 博弈 :第 一 , 小 孩 选 择 一 个 行动 A, 可 
使 孩子 获得 收入 到 (4), 并 使 家 长 得 到 收入 [,(A (可 以 认为 工 (4 ) 为 孩子 
WA A 发 生 的 各 种 成 本 后 的 净 收 益 ); 第 二 ,家 长 观测 到 收入 工 MI, R 
后 选择 给 孩子 的 奖励 或 惩罚 Bo BF MRR UCI + B), 家 长 的 收益 为 
VU, —B) +k. +B) AP 2>O 反映 出 家 长 关心 孩子 的 福利 。 假 定 行 
动 是 一 个 非 负数 字 , A 之 0, 收 入 函数 LAA [AD) 为 严格 止 且 分 别 在 A。 
>0 和 A,>0 达到 最 大 值 ;奖励 或 惩罚 5 为 或 正 或 负 的 数字 ; 且 效 用 函数 
U 和 VV 递增 并 严格 外。 证 明 "“ 宠 坏 的 苇子 "(Rotten Kid) 定 理 : 在 逆向 归纳 
解 中 , 孩子 选择 可 使 全 家 收入 (4)+ 了 (4) 最 大 化 的 行为 ,尽管 在 效用 画 
数 中 , 只 有 家 长 显示 出 利他 的 特点 。 

2.2 现在 假设 家 长 和 和 孩子 进行 一 个 不 同 的 博 讲 , 首先 由 布 坎 南 
(Buchanan, 1975) 所 分 析 。 令 收入 到 和 1 为 外 生 给 定 的 , 第 一 , 孩子 决定 收 
AL 中 的 多 少 用 于 储蓄 5S) 以 备 将 来 , 并 消费 掉 其 余部 分 1 S$。 第 二 ,家 
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长 观测 到 孩子 的 选择 S 并 决定 一 个 赠与 额 B。 孩 子 的 收益 为 当期 和 未 来 
的 效用 之 和 UL- S)+ U2z(S + B8); 家 长 的 收益 为 V(I, 一 B)+ [Ui 
(I.-S)+ U2(S+B8)] 。 假 定 效 用 函数 U U: 和 V 递增 并 且 严 格 四 ,证 
明 存 在 “乐善好施 那 论 "(Samaritan’s Dilemma) :在 逆向 归纳 解 中 , 孩子 的 储 
BAER, 从 而 可 诱 使 家 长 给 巴 更 高 的 赠与 ( 即 如 果 S 增加 ,并 使 B 相应 姜 
少 ,家 长 和 孩子 的 福利 都 会 提高 )。 

2.3 假定 鲁 宾 斯 坦 的 无 限期 讨价还价 博弈 中 , 参与 者 的 贴现 因子 不 
同 ,参与 者 1 为 fl, 参与 者 2 为 8。 运 用 本 书 中 的 论证 方法 证 明 在 逆向 归 
纳 解 中 , 参与 者 1 向 2 提出 的 解决 方案 为 
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并 被 参与 者 2 接受 。 

2.4 ”两 合伙 人 希望 能 完成 一 个 项 目 , 在 项 目 结束 时 ， 每 一 合伙 人 得 到 
收益 YY， 担 结束 前 则 一 无 所 得 ， 尚 需 R 的 成 本 。 两 合伙 人 都 不 能 承诺 只 
党 自己 的 力量 完成 项 目 ， 于 是 他 们 决定 进行 如 下 的 两 阶段 博弈 : 在 第 一 阶 
段 ， 合 伙 人 上 工 选 择 为 完成 项 目 所 作 的 贡献 cl， 如 果 这 一 贡献 中 以 令 项 目 
完成 ， 则 博弈 结束 ， 每 一 参与 者 得 到 收益 Vi 如 果 这 一 贡献 不 足以 令 项 
目 完成 ( 即 ci< 尺 )， 则 在 第 二 阶段 合伙 人 2 选择 为 完成 项 目 所作 的 贡献 
co, SUR (不 考虑 贴现 的 ) 两 个 贡献 之 和 足以 完成 项 目 ， 则 搏弈 结束 ， 每 
一 参与 者 得 到 VY; 如 果 贡 献 之 和 不 足以 完成 项 目 ， 则 博弈 结束 ， 两 参与 
者 所 得 的 收益 均 为 0。 

每 一 合伙 人 必须 从 其 他 可 带 来 收益 的 活动 中 抽取 部 分 资金 , 投入 到 该 
项 目 ,这 样 敌 的 最 优 方法 是 先 从 收益 最 低 的 其 他 活动 中 抽 资 ,结果 使 贡献 的 
(机 会 ) 成 本 为 贡献 大 小 的 凸 函数 。 航 设 对 每 一 参与 者 贡献 c HREH c’, 
并 假定 参与 者 1 对 其 第 二 阶段 的 收益 用 贴现 因子 8 进行 贴现 。 针 对 三 个 
参数 1V, R ,31 的 不 同情 况 ,分 别 计算 出 此 两 阶段 贡献 博弈 惟一 的 道 向 归纳 
解 ;参见 阿 茶 马 蒂 (Admati) 和 佩 里 (Perry) 对 无 限 重复 情况 的 讨论 。 

2.5 假设 一 家 企业 希望 某 工 人 能 投资 于 企业 专门 技术 S, 但 此 项 技术 
非常 模糊, 以 致 法 院 无 法 确定 工人 是 否 已 经 掌握 。( 例 如 , 企业 也 许 会 让 职 
工 * 熟 悉 我 们 这 几 是 如 何 运作 的 "或 “在 我 们 的 某 潜在 市 场 成 为 专家 "。) 从 而 
企业 无 法 与 职工 订立 半 约 ,偿付 工人 投资 成 本 :即使 职工 确实 进行 了 投资 ， 
企业 也 可 以 声称 职工 没有 进行 投资 , 并 且 法 院 无 法 辨别 哪 一 方 是 正确 的 。 
类 似 的 ,如 果 企业 预先 支付 费用 , 职工 也 不 能 保证 会 投资 于 企业 的 专门 
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技术 。 

但 是 , 企业 能 够 通过 (可 信 的 ) 承 诺 提 职 来 激励 职工 进行 投资 ,具体 方法 
如 下 。 假 设 企业 里 有 两 个 工作 岗位 , 一 个 容易 (E), 一 个 复杂 (DD), FAS 
门 技术 对 这 两 个 岗位 都 是 有 用 的 , 只 是 对 复杂 的 岗位 作用 更 大 一 些 ypo< 
yp0< YEs< yps:; 其 中 yi 表示 职工 在 岗位 i(i=E 或 DD) 工 作 \ 技 术 水 平 为 j 
(=0 或 5) 时 的 产 出 ,假定 企业 可 以 承诺 对 不 同 的 岗位 支付 不 同 的 工资 
we 及 wp, 但 每 一 种 工资 都 不 低 于 工大 另 谋 职业 的 收入 , 这 里 我 们 通过 标 
准 化 处 理 , 使 后 者 等 于 0。 

博弈 进行 的 时 间 顺 序 如 下 :在 时 点 0 企业 选 定 we 和 wp, 工人 观测 到 
企业 选择 的 工资 水 平 。 在 时 点 1 工人 加 入 企业 并 且 能 够 以 成 本 < 取得 技能 
S( 这 里 我 们 忽略 了 第 一 阶段 的 产 出 及 工资 , 由 于 工人 尚未 取得 技能 , 企业 
聘用 工人 到 岗位 E 是 有 效率 的 )。 假 定 yps 一 yeo >>c, 从 而 对 工人 来 讲 投 资 
学 习 技 术 是 有 效率 的 。 在 时 点 2 企业 观测 工人 是 否 取 得 了 技术 技能 , 然后 
决定 是 否 在 工人 寥 虱 的 第 二 (也 是 最 后 ) 春 段 提升 工人 到 岗位 Do 

工人 在 岗位 ; 工作 ,技术 水 平 为 j 时 , 企业 第 二 阶 发 的 利润 为 y; - wio 
工人 第 二 阶 盘 在 岗位 ; 工作 的 收益 为 wwi Mw; c, 决 定 于 工人 是 否 在 第 一 
阶段 投资 于 工作 技能 。 请 求 出 博弈 的 道 向 归纳 解 。 参 见 普 伦 德 加 斯 特 
(Prendergast, 1992) 内容 更 为 丰富 的 模型 。 


第 2.2 节 

2.6 在 一 个 由 三 个 赛 头 歼 断 者 操纵 的 市 场 , 反 需 求 函 数 由 P(Q)= a 
-Q Bb, BE Q=qtatas, a 表示 企业 i 生产 的 产量 。 每 一 企业 生 
产 的 边际 成 本 为 常数 c, 并 且 没 有 固定 成 本 。 企 业 按 以 下 顺序 进行 产 出 决 
策 ; (了) 企业 1 选择 q 20; (2) Pak 2 和 3 观测 到 qi, 并 同时 分 别 选择 gz 和 
g3。 求 出 此 博弈 的 子 博 弃 精炼 解 。 

2.7 假设 一 个 工会 是 一 守 头 垄断 市 场 中 所 有 企业 惟一 的 劳动 力 供给 
者 ,就 像 汽 车 工人 联合 会 (United Auto Workers) 对 于 通用 、 福 特 、 克 莱 斯 勒 
等 大 的 汽车 厂家 。 令 博弈 各 方 行动 的 时 间 有 顺序 类 似 于 第 2.1.C 节 的 模型 ， 
《1) 工 会 确定 单一 的 工资 要 求 w, 适用 于 所 有 的 企业 ;(2) 每 家 企业 了解 
到 (并 接受 )w, 然后 同时 分 别 选 择 各 自 的 雇佣 水 平 L;;(3) 工 会 的 收益 为 
Cw we LAE w 为 工会 成 员 到 另外 行业 谋 职 可 取得 的 收入 . 工 = 工 ;+ 

+L, 为 工会 在 本 行业 企业 的 总 就 业 水 平 ; 企业 的 利润 为 x(zw, Li ,其 

中 决定 企业 i 利润 水 平 的 要 素 如 下 。 
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所 有 企业 都 有 同样 的 生产 函数 : 产 出 等 于 劳动 力 ; = Lie PHS 
产 出 为 Q=a, te +g, 时 的 市 场 出 清 价格 为 p(Q)=a -QQ。 为 使 问 
题 简化 , 假设 企业 除 工资 支出 外 没有 勇 外 的 成 本 。 请 求 出 此 博弈 的 子 博 
弈 精炼 解 。 在 子 博弈 精炼 解 中 , 企业 的 数量 是 如 何 ( 以 及 为 什么 ) 影 响 工 
会 效用 的 ?7 

2.8 根据 拉 齐 尔 (1989), 对 第 2.2.D 节 的 工作 竞赛 模型 修改 如 下 : 令 
工人 的 产 出 为 y= ei 一 (1/2)sj +e, BP 520 代表 了 工人 的 放 意 破坏 ; 
HALA i 由 于 (生产 及 破坏 ) 付 出 努力 产生 的 负 效 用 为 g(e:)+g(s;)。 证 
明 最 优 的 奖励 水 平 wn - wi 要 小 于 ( 书 中 ) 不 考 虚 进行 酸 坏 的 情况 。 

2.9 考虑 两 个 国家 , 在 时 点 1, 两 国 的 关税 都 非常 高 , 以 致 根本 没有 贸 
易 。 在 每 一 个 国家 内 , 工资 和 就 业 的 决定 与 第 2.1.C 节 垄 断 工 会 模型 相 
同 。 在 时 点 2, 所 有 的 关税 都 联 消 了 ,每 一 工会 决定 本 国 的 工资 水 平 ,但 每 
一 企业 同时 为 两 国 市 场 生 产 产品 。 

假定 每 一 国家 的 反 需 求 函数 为 P(Q) =a- Q, 其 中 Q 为 该 国 市 场 上 
的 总 产量 。 令 每 一 企业 的 生产 函数 为 g = 工 , 从 而 工资 为 企业 的 惟一 成 本 ， 
并 且 令 工会 的 效用 函数 为 U(w, 工 } =《w 一 we) 二 ,其 中 wy 为 工人 另 谋 职 
业 可 得 收入 。 请 解 出 时 点 1 博弈 的 逆向 归纳 解 。 

下 面 考 虑 时 点 2 的 下 述 搏弈 。 第 一 , 两 工会 同时 选择 工资 水 平 w! 和 
wr 然后 企业 i 观测 到 工资 并 选择 其 国内 、 国 外 市 场 的 产 出 水 平 ,i 国企 业 
的 产 出 (内 销 和 出 口 ) 分 别 用 h 和 e; 表示 。 企业 i 所 有 的 生产 都 在 本 国 ,于 
ERREK wh; t e), PEFR, EAR a A OF 
Fa Dee HSL 2 AA a FE RR RT. BL Huizin- 
ga (1989) 同 类 问题 的 其 他 例子 。 
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2.10 下 图 所 示 的 同时 行动 博弈 重复 进行 两 次 ,并 且 第 二 阶段 开始 前 
双方 均 可 观测 到 第 一 阶段 的 结果 , 不 考虑 贴现 因素 。 变 量 x 大 于 4, 因而 
《4,4) 在 一 次 性 博 蛮 中 并 不 是 一 个 均 奖 收益 。 对 什么 样 的 x+, (双方 参与 者 
同时 采取 ) 下 述 战 略 是 一 个 子 博 弈 精炼 纳什 均衡 ? 

第 一 阶段 选择 Qi, 如 果 第 一 阶段 的 结果 为 (Qi, Q), 在 第 二 春 段 选择 
Pi 如 果 第 一 阶段 的 结果 为 (y, Q2), 其 中 yO), 第 二 阶段 选择 Ri; 如 果 第 
一 阶段 的 结果 为 (Qi z) EP z 关 Q2, 第 二 阶段 选择 Si; 如 果 第 一 阶段 结 
果 为 (y, z), 其 中 y 关 Qi 且 AQ, WEB NEGE Pio 
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Pa Q: Re Sa 


Py 2,2 z -14,0 0.0 


Q| az 4,4 -1,0 0,0 


Ri| DO 0,0 0,2 0.0 


Si] 0% -1 0, -1 i 2,0 


2.11 下 图 的 同时 行动 博弈 重复 进行 两 次 ,第 二 阶段 开始 前 参与 双方 
可 以 观测 到 第 一 阶段 的 结果 。 不 考虑 贴现 因素 。 在 一 个 纯 战 略 子 博弈 精炼 
纳什 均衡 中 ,能 否 在 第 一 阶段 达到 {4,4) 的 收益 ? 如 果 可 以 , 给 出 相应 的 战 
了 略 。 如 果 不 能 ,证 明 为 什么 。 


L C R 


3,1 6,0 5,0 
2,1 1,2 3,1 
B 1,2 01 4.4 


g4 


2.12， 何 为 一 个 重复 博弈 的 战略 ? 何 为 重复 博弈 的 子 博弈 ? 何 为 子 博 
弃 精 炼 纳什 均衡 ? 

2.13 回顾 习题 1.7 中 静态 贝 特 兰 德 双 头 醉 断 模型 (同类 产品 ) ;企业 
同时 给 产品 定价 ;对 企业 i 产品 的 需求 ,如 果 p< pj, H a- ps p> 
方 ,为 0; 如 果 p= p 则 为 (a - p;)/2; 边 际 成 本 为 c<a。 考 碰 基 于 上 述 阶 
眉 博 弈 的 无 限 重 复 博弈 。 证 明 在 一 个 子 博弈 精炼 纳什 均衡 中 , 当 且 仅 当 8 
>1/2 时 , 企业 可 以 使 用 触发 战略 (只 要 发 生 任何 背离 , 就 永远 转向 阶段 博 
弈 的 纳什 均 了 衡 ) 以 维持 垄断 条 件 下 的 价格 水 平 。 

2.14 假设 在 习题 2.13 中 的 无 限 重 复 贝 特 兰 德 博弈 中 的 需求 随机 波 
动 :在 每 一 阶段 , 需求 函数 的 截 距 是 ay WARK rÈ alar < ar) 的 概率 
为 1- ;不 同 阶段 同 的 需求 相互 独立 。 恨 设 每 一 阶段 两 企业 在 选择 当期 价 
略 之 前 都 可 以 观测 到 本 期 的 需求 水 平 。 两 种 需求 水 平 下 的 垄断 价格 (pp 和 
pi) 分 别 是 多 少 ? 

解 出 8* ,使 得 在 子 博弈 精 烤 纳什 均衡 中 , 两 企业 能 够 采用 触发 战略 维 
HERA ACE BIS i = 五 ,上 ,需求 为 ai 时 选择 价格 pp,) 的 最 小 贴现 
因子 $ 的 值 。 并 对 处 于 1/2 和 86' 之 间 的 所 有 3, 求 出 最 高 价格 上 (3) ,使 得 
在 子 博 弈 精炼 纳什 均衡 中 , 企业 可 通过 运用 触发 战略 , 在 高 需求 水 平时 维持 
价格 pCO), 在 低 需 求 水 平时 维持 价格 po (SB RN he ew, 
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1986) 

215 BRE-TPHGELBS HA n 个 企业 。 反 需求 函数 由 P 
(Q)=a -QQ 给 出 ,其 中 QQ= ql+…+ gn。 考 虚 基 于 这 一 阶段 博弈 的 无 限 
重复 博弈 。 求 出 最 小 的 8 值 , 使 得 在 子 博弈 精炼 纳什 均衡 中 企业 能 够 运用 
触发 战略 维持 垄断 产 出 水 平 。 这 一 结果 随 n 的 变化 将 如 何 变化 ? 为 什么 ? 
如 果 6 非常 之 小 ,以致 企业 无 法 通过 采用 触发 战略 来 维持 垄断 产 出 , 求 出 
能 够 通过 击 发 战略 维持 住 的 、 和 使 利 汐 最 大 化 的 相应 的 子 博弈 精炼 纳什 均衡 。 

2.16 在 第 2.1.C 节 分 析 的 工资 和 就 业 模型 中 .逆向 归纳 解 对 社会 来 

讲 并 不 是 有 效率 的 。 并 且 在 实践 中 , 企业 和 工会 今天 就 一 个 3 年 期 合同 的 
SBT RA, FE 3 年 以 后 再 就 下 一 期 的 合同 条 款 进行 谈判 , 如 此 等 
等 。 从 而 ,两 者 之 何 的 关系 用 重复 博弈 来 表示 可 能 更 为 准确 , 参见 ( 埃 斯 皮 
诺 萨 和 里 , 1989). 
这 个 问题 可 导出 在 无 限 重复 博弈 中 子 博 弈 精炼 纳什 均衡 帕 累 托 优 于 一 
次 性 博弈 中 道 向 归纳 解 的 条 件 。 分 别 用 U* 和 oe” 表示 一 次 性 博弈 逆向 归 
纳 解 中 工会 效用 和 企业 利润 。 考 虑 另外 的 一 个 工资 一 就 业 组 合 (z, 工 ) 
以 及 与 之 相应 的 效用 一 一 利润 组 合 (U, x), 假 设 双方 的 贴现 因子 都 是 8( 每 
3 年 为 一 个 阶段 ), 请 推导 kw, 了 上 ) 应 满足 的 条 件 , 使 得 (t)(U, r)i RIER 
PU, OBONU, x) 为 无 限 重复 博弈 的 一 个 子 博弈 精炼 纳什 均衡 的 
结果 ,其 中 只 要 发 生 任 何 偏离 就 将 永远 转向 (U* ,x *)。 

2.17 考虑 如 下 的 一 家 企业 和 一 系列 工人 之 间 的 无 限期 博弈 , 每 名 工 
人 只 出 现在 一 个 阶段 。 在 每 一 阶段 工人 选择 努力 工作 , 这 时 努力 成 本 为 c, 
生产 的 产 出 为 y; 或 不 做 性 何 努力 ,也 没有 任何 产 出 ,不 发 生 任何 成 本 。 如 
果 生 产 出 了 产 出 ,企业 拥有 成 果 但 可 以 通过 支付 工资 的 方式 与 工人 分 享 . 具 
体 方法 将 在 后 面 提 到 。 假 定 在 一 个 阶段 的 开始 工人 可 选择 另外 的 就 业 机 
会 , ( 减 去 努力 成 本 的 ) 净 价值 为 0, 并 且 工人 不 能 被 强迫 接受 一 个 小 于 0 的 
工资 。 同 时 假定 y > c, 从 而 努力 工作 是 有 效率 的 。 

在 每 一 阶段 内 ,博弈 进行 的 时 间 顺 序 如 下 ;首先 工人 选择 一 个 努力 
水 平 ,然后 企业 和 工人 都 可 以 观察 到 产 出 的 情况 ,最 后 企业 选择 支付 给 
工人 的 工资 水 平 。 假 定 事先 不 能 达成 任何 有 约束 力 的 工资 协议 :企业 选 
择 的 工资 是 完全 不 受 限制 的 。 那 么 , 在 单一 阶段 的 博弈 中 , 子 博 弈 精炼 
意味 着 无 论 工 人 的 产 出 如 何 , 企业 给 出 的 工资 都 为 0, 于 是 工人 也 不 会 
进行 任何 努力 。 

现在 考虑 无 限期 时 的 情况 , 我 们 已 提 到 每 个 工人 只 出 现在 一 个 阶段 。 
不 过 我 们 可 以 假定 在 阶段 上 的 开始 ,博弈 前 面 上 - 1 个 阶段 的 进行 过 程 都 可 
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被 将 在 z 阶段 工作 的 工人 观测 到 (可 以 想象 到 ,这 些 知 识 在 工人 之 间 代 代 相 
传 )。 假 设 企业 未 来 收益 每 一 阶段 的 贴现 因子 为 8。 写 出 无 限期 博弈 中 一 
个 子 博弈 精炼 均衡 下 企业 和 每 个 工人 的 战略 ,使 得 对 足够 大 的 贴现 因子 3， 
在 均衡 情况 下 ,每 个 工人 都 努力 工作 ,生产 出 产 出 y, 并 给 出 上 述 均衡 存在 
的 充分 必要 条 件 。 


第 2.4 节 

2.18 对 一 个 任意 的 博弈 ,解释 其 战略 、 信 息 集 以 及 子 博弈 的 概念 。 

2.19 在 第 2.1.DD 节 分 析 的 三 阶段 鲁 宾 斯 坦 讨 价 还 价 模型 中 ,我 们 解 
出 了 逆 向 归纳 解 。 它 的 子 博 弈 精炼 纳什 均衡 是 什么 ? 

2.20 ”在 无 限期 鲁 宾 斯 坦 讨 价 还 价 模型 中 考虑 下 面 的 战略 (注意 习惯 
性 的 表示 方法 ,开价 (s,1- *) 意 味 着 参与 者 1 将 会 得 到 s, 参与 者 2 将 得 到 
1- *，, 而 不 论 是 哪 一 方 提出 的 条 件 ): 令 5 = 1/1 +d), SSS 1 坚持 开价 
(s*,1-s*), FARA s 产 8 s 时 , 才 接受 对 方 开价 (3,1 一 3); 参 与 着 2 
坚持 开价 (1 一 s* ,s* ), 并 且 只 有 当 1 - sees “时 才 接 受 对 方 开价 (s,1 一 
s*)。 证 明 这 两 个 战略 是 一 个 纳什 均衡 , 并 证 明 这 一 均衡 是 子 博弈 精炼 的 。 

2.21 给 出 第 2.1 节 搞 述 的 手雷 搏弈 的 扩展 式 表 述 及 标准 式 表述 。 并 
分 列 写 出 其 纯 战 略 纳什 均衡 、 逆 向 归纳 解 和 子 博弈 精炼 纳什 均衡 。 

2.22 给 出 第 2.2.B 节 讨 论 的 银行 挤 提 博 弈 的 扩展 式 表述 及 标准 式 
表述 。 其 纯 战 路 子 博弈 精炼 纳什 均衡 是 什么 ? 

2.23 ”一 个 卖方 和 一 个 买方 打算 进行 交易 。 在 他 位 交易 之 前 , 买方 可 
以 作 一 项 投 次 ,从 而 提高 标的 物 对 他 的 价值 。 这 项 投资 不 能 被 卖方 观察 到 ， 
从 而 也 不 会 影响 标的 物 对 卖方 的 价值 , 后 者 我 们 标准 化 为 0( 举 一 个 例子 ， 
设想 一 家 企业 购买 另 一 企业 , 在 兼并 前 的 一 段 时 间 , 兼并 方 可 以 采取 措施 ， 
改变 其 计划 推出 的 产品 ,以 使 之 在 羔 并 后 与 被 兼并 方 的 生产 相配 合 。 如 果 
产品 开发 需要 相当 长 时 间 , 而 产品 生命 周期 又 比较 短 , 兼并 之 后 兼并 方 已 没 
有 充足 的 时 间 进 行 此 项 投资 了 )。 购 买方 对 标的 的 初始 价值 为 ">0; 一 项 
投资 使 得 购买 方 的 价值 变 为 z+ 了 ,但 相应 增加 了 成 本 1?。 博 弈 进行 的 时 
则 顺序 如 下 :首先 , 购买 方 选择 投资 水 平 [发生 或 本 下 ;第 二 ,卖方 不 能 观 
WA 卫 , 但 开 出 标的 的 卖 价 为 p; 第 三 , 买方 或 者 接受 ,或 者 拒绝 卖方 的 开 
价 : 如 果 买 方 接受 , 则 买方 的 收益 为 w+ I pp 一 了 ,卖方 的 收益 为 ;如果 拒 
绝 , 则 双方 的 收益 分 别 为 -~ 2? 和 0。 证 明 这 一 博弈 不 存在 纯 战 略 子 博 弈 精 
卉 纳什 均衡 。 解 出 博弈 的 混 人 台 战 略 纳什 均衡 , 其 中 买方 的 混合 战略 中 , 出 现 
概率 为 正 的 只 有 两 种 投资 水 平 , 并 且 卖 方 的 混合 战略 中 , 出 现 概率 为 正 的 只 
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有 两 个 价格 水 平 。 
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非 完 全 信息 静态 博弈 


从 本 章 开始 ,我 们 研究 非 完 全 信息 博弈 , 有 时 也 称 为 贝 叶 斯 博弈。 
前 面 讲 过 , 在 一 个 完全 信息 博弈 中 , 参与 者 的 收益 函数 是 共同 知识 ;而 在 
非 完 全 信息 博弈 中 , 与 之 相反 , 至少 有 一 个 参与 者 不 能 确定 另 一 参与 者 
的 收益 函数 。 非 完全 信息 静态 博弈 的 一 个 常见 例子 是 密封 报价 折 卖 
(sealed-bid auction) :每 一 报价 方 知道 自己 对 所 售 商 品 的 估价 , 但 不 知道 
任何 其 他 报价 方 对 商品 的 估价 ;各 方 的 报价 放 在 密封 的 信封 里 上 交 , 从 
而 参与 者 的 行动 可 以 被 看 作 是 同时 的 。 不 过 , 绝 大 多 数 在 经 济 领域 非常 
有 意思 的 贝 叶 斯 博弈 是 动态 的 。 我 们 在 第 4 章 将 会 看 到 , 私人 信息 的 存 
在 十 分 自然 地 导致 享有 私人 信息 的 一 方 试 图 去 沟通 (或 者 误导 ), 同 时 也 
使 得 没有 私人 信息 的 一 方 试 图 去 学 习 和 反应 。 这 些 都 是 博弈 中 加 有 的 
动态 因素 。 

第 3.1 节 给 出 静态 贝 叶 斯 博弈 的 标准 式 表 述 和 页 叶 斯 纳什 均衡 的 定 
义 。 由 于 这 些 定义 非常 抽象 并 有 些 复杂 , 我 们 通过 一 个 简单 的 例子 一 一 非 
对 称 信 息 下 的 古 诺 竞争 一 一 介绍 主要 思想 。 

第 3.2 节 讨 论 三 个 应 用 的 例子 。 第 一 ,我 们 就 第 1 章 中 给 出 的 对 混合 
战略 的 解释 进行 正式 讨论 :好 参 与 者 j 的 混合 战略 代表 了 对; 所 选择 纯 
战略 的 不 确定 性 , 并且 j 的 选择 基于 他 所 掌握 的 一 小 点 儿 私 人 信息 。 第 二 ， 
我 们 分 析 一 个 密封 报价 拍卖 的 例子 , 其 中 竞买 方 的 估 虱 是 私人 信息 ,但 是 卖 
方 对 商品 的 估价 却 为 各 方 所 周知 。 最 后 , 我 们 考虑 买方 和 卖方 各 自 都 掌握 
一 定 私人 信息 的 情况 (如 在 企业 中 , 企业 了 解 工人 的 边际 产 出 , 工人 则 知道 
自己 的 机 会 成 本 )。 我 们 分 析 一 个 称 为 双向 拍卖 的 交易 博弈 ;卖方 开 出 一 个 
变价 ,同时 由 买方 给 出 一 个 买 价 ; 如 果 后 者 大 于 前 者 , 则 以 两 个 价格 的 平均 
值 成 交 。 

第 3.3 节 我 们 给 出 并 证 明显 示 原 理 (Revelation Principle), 并 简要 讨论 
其 在 存在 私人 信息 时 的 博弈 设计 方面 的 应 用 。 
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3.1 理论 :静态 贝 叶 斯 博弈 和 贝 叶 斯 纳什 均 街 


3.1.A 一 个 例子 : 非 对 称 信息 下 的 古 诺 竞争 


考虑 如 下 的 古 诺 双 头 模 型 。 其 中 市 场 反 需 求 函数 由 P(Q)=a-@Q 给 
出 ,这 里 @ = gi+ 9? 为 市 场 中 的 总 产量 。 企 业 1 OMERMH Cila) = 
qi, 不 过 企业 2 的 成 本 函数 以 9 的 概率 为 Ci(g2) = chga, 以 1- 6 的 概率 为 
Cz(q2) = ciq XE c< cns。 并且 信息 是 不 对 称 的 :企业 2 知道 自己 的 成 
本 函数 和 企业 1 的 成 本 函数 , 企业 1 知道 自己 的 成 本 函数 ,但 却 只 知道 企业 
2 边际 成 本 为 ca 的 概率 是 6, 边际 成 本 为 cr 的 概率 是 1 一 9( 企 业 2 可 能 是 
新 进入 这 一 行业 的 企业 , 也 可 能 刚刚 发 明 一 项 新 的 生产 技术 )。 上 上述 一 切 都 
是 共同 知识 :企业 1 知道 企业 2 享有 信息 优势 ,企业 2 知道 企业 1 知道 自己 
的 信息 优势 ,如 此 等 等 。 

自然 地 , 企业 2 的 边际 成 本 较 高 时 和 较 低 时 , 它 希 望 生产 的 产 出 水 平 是 
不 同 的 (一 般 而 言 ,前 一 种 情况 时 的 产 出 要 更 低 一 些 )。 企 业 1 从 自己 的 角 
度 ,也 会 预测 到 企业 2 根据 其 成 本 情况 将 选择 不 同 的 产量 。 用 oz (cy) 和 
gz (cL) 分 别 把 企业 2 的 产量 选择 表示 为 成 本 的 男 数 , 并 令 gy 表示 企业 1 
的 单一 产量 选择 。 如 果 企 业 2 的 成 本 较 高 , 它 会 选择 qz (ca) 满 足 : 


maxl (a -qr 一 az) 一 ca]9z ， 
2 


类 似 地 , 如 果 企 业 2 的 成 本 较 低 , ez (cr ) 应 满足 下 式 
max[(@ -gr 一 92) 一 cqz - 
% 
最 后 ,企业 1 知道 企业 2 成 本 较 高 的 概率 为 9, 并 应 该 能 预测 到 企业 2 的 产 
重 选择 将 分 别 为 g7 (cn) 或 97 (cr)。 从 而 ,企业 工 选择 满足 下 式 的 97 
max@[ (a -qı a2 (cH)) -ela t+ G- l(a- qi= gi (en) -elgi 
以 使 期 望 的 利润 最 大 化 。 
上 面 三 个 最 优化 问题 的 一 阶 条 件 为 


4 an =j n a-qi -e 
q2 (eq) = 人 一 叶 一 竺 > 42 Cea) == ’ 


s bla- g2 en} — ce) + 1 - ala - of Ce) - 6) 
c= 2 os 
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假定 这 些 一 阶 条 件 可 以 决定 上 述 最 优化 同 题 的 解 (请 回 厂 习 题 1.6, 在 完全 
信息 古 庶 双 头 博 穿 中 ,如果 企业 间 的 成 本 差别 足够 大 , 则 在 均衡 情况 下 ,高 
RARE AER hh. FARR], 求 出 这 里 不 会 出 现 类 似 问题 的 充 
分 条 件 )。 

三 个 一 阶 条 件 构 成 的 方程 组 的 解 为 


fa — ent a 
gz (eq) = SHEE LO- ey ， 


a-2e +e 
3 


qi (c= -Elne » 


ai= ga-2c+t+ARn+ (1 -cL 

把 这 里 的 ez (ca)、\ ez (cM gy 与 成 本 分 别 为 cl 和 cz 的 完全 信息 古 
诺 均 衡 相 比较 , 假定 ci\c* 的 取 值 可 使 得 两 个 企业 的 均衡 产量 都 为 正 , 在 完 
全 信息 的 条 件 下 , 企业 的 产 出 为 or = (a -2c + cj)/3。 然 而 与 之 不 同 
的 , 在 非 完全 信息 条 件 下 , of (cH) 要 高 于 (a - ey + c)/3, q? 《cL) 却 低 于 
(a-2er+e)/3o 之 所 以 会 出 现 这 种 情况 ,是 因为 企业 2 不 仅 根 据 自己 的 
成 本 调整 其 产 出 ,同时 还 将 考虑 到 企业 ! 的 情况 选择 最 优 反 应 。 例 如 , 如果 
企业 2 的 成 本 较 高 , 它 就 会 因 戌 本 较 高 而 碱 少 产量 ,但 同时 又 会 生产 稍 多 一 
些 ,因为 它 知道 企业 1 将 根据 期 望 利润 最 大 化 的 原则 决定 产 出 , 从 而 要 低 于 
企业 1 确 知 企业 2 成 本 较 高 时 的 产量 。( 这 一 例子 可 能 会 引起 误解 的 地 方 ， 
qi 恰好 等 于 企业 1 在 相应 的 两 个 完全 信息 博弈 中 古 诺 产量 的 期 望 值 。 
一 般 情况 下 这 一 点 是 不 成 立 的 ,例如 可 以 考虑 企业 i 的 总 成 本 为 cq? 的 博 
Bo) 


3.1.B 静态 贝 叶 斯 博弈 的 标准 式 表 述 


前 面 已 讲 过 一 个 完全 信息 x 人 博弈 的 标准 式 表述 为 G = [Sps 5,5 
ul， unl, 其 中 Si 为 参与 者 i 的 战略 空间 , ui(s1,…, sw) 为 所 有 参与 者 分 
别 选择 战略 (s1,…, su) 时 参与 者 的 收益 。 不 过 ,根据 第 2.3.B 节 的 讨论 ， 
在 同时 行动 的 全 信息 博弈 中 ,参与 者 的 一 个 战略 就 是 一 个 简单 的 行动 ,于 是 
我 们 又 可 以 写 为 G= AL…, Aniun wn1, 其 中 A, 为 参与 者 i 的 行动 
空间 , wi(a1,…, a4,) 为 在 所 有 参与 者 分 别 选择 行动 (a1,…, a,) 时 参与 者 i 
的 收益 。 为 了 给 下 面 描述 非 完 全 信息 静态 博弈 的 时 间 顺 序 作 准 备 , 我 们 先 
把 一 个 完全 信息 静态 博弈 的 时 间 顺 序 描述 如 下 :(1) 参 与 者 同时 选择 行动 
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(参与 者 i 从 可 行 集 A; 中 选择 a;), 热 后 (2) 参 与 者 i 得 到 收益 u Can 


ayo 

现在 ,我 们 要 建立 非 完 全 信息 同时 行动 博弈 的 标准 式 表 述 ,也 称 为 静态 
贝 叶 斯 博弈 。 首先 要 表示 出 非 完全 信息 的 关键 因素 , 即 每 一 参与 者 知道 他 
自己 的 收益 函数 ,但 也 许 不 能 确 知 其 他 参与 者 的 收益 函数 。 令 参与 者 2 可 
能 的 收益 函数 表示 为 (ay ast, 其 中 n 称 为 参与 者 i 的 类 型 
《type), 它 属于 一 个 可 能 的 类 型 集 ( 亦 称 为 类 型 空间 (type space)) Ti, 每 一 类 
型 右 都 对 应 着 参与 者 ; 不 同 的 收益 函数 的 可 能 情况 。 

举 一 个 抽象 的 例子 。 假 设 参 与 者 ; 有 了 两 种 可 能 的 收益 函数 , 我们 也 可 
以 说 参与 者 i 有 两 种 类 型 , t; 和 zo, 参与 者 i 的 类 型 空间 为 T= lea eal, 
并 且 参 与 者 i 的 两 种 收益 函数 分 别 为 zi (ai yan36D 和 (ma(aly ans 
5iz)。 我 们 可 以 用 参与 者 的 每 一 类 型 都 对 应 着 该 参与 者 不 同 收 益 天 数 的 可 
能 情况 这 一 思路 ,来 表示 参与 者 有 不 同 可 行 行动 集 时 的 情况 , 具体 方法 如 
下 。 例 如 ,假设 参与 者 i 的 可 行 行动 集 是 1a,61 的 概率 为 g, Ela, b, c) H 
概率 为 1 - 9, 于 是 我 们 可 以 说 i 有 两 种 类 型 (zi 和 zi2, 其 中 in 的 概率 为 
9), 并 且 对 两 种 类 型 我 们 都 可 以 认为 其 可 行 的 行动 集 是 1a，b，c1, 只 是 对 
类 型 si 定义 其 选择 行动 。 的 收益 为 - co。 

作为 更 为 有 具体 的 例子 , 考虑 前 -- 节 里 的 古 诺 博弈 。 企 业 的 行动 是 它们 
的 产量 选择 g, 和 q 企业 2 有 两 种 可 能 的 成 本 五 数 , 从 而 有 两 种 可 能 的 
利润 或 收益 函数 : 


mais gzicL)= [Ca - gi- g2)— es] 92 
和 
zat9l,9g2icb) 一 [(a 一 91 一 2) 一 ca]qz 
企业 1 只 有 一 种 可 能 的 收益 函数 : 
mlg q2;c)= [Ca- g1- 92) ~ cqr.: 
我 们 说 企业 2 的 类 型 空间 为 Ta = ler, cyl, 企业 1 的 类 型 空间 为 T;= 1c1。 
在 这 样 定义 参与 者 的 类 型 之 后 , 说 参与 者 i 知道 自己 的 收益 函数 也 就 
等 后 于 说 参与 者 i 知道 自己 的 类 型 , 类似 地 ,说 参与 者 i 可 能 不 确定 其 他 参 
与 者 的 收益 函数 , 也 就 等 同 于 说 参与 者 i 不 能 确定 其 他 参与 者 的 类 型 ,我 们 
用 = Ley tioo teats o ta ER. HE Tame AA TE 
的 集合 ,用 概率 p,(:-;izi) 表 示 参 与 者 在 知道 自己 的 类 型 是 n 的 前 提 下 ， 
对 其 他 参与 者 类 型 ( 即 * -;,) 的 推断 (belief)。 在 第 3.2 节 分 析 的 所 有 应 用 中 
《以 及 绝 大 多 数 文献 中 ), 参与 者 之 间 的 类 型 是 相互 独立 的 ,这 种 情况 下 p; 
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(ii) 与 去 不 相关 ,于 是 我 们 可 以 把 参与 者 的 推断 写成 Pi Pho MÆ 
也 存在 参与 者 之 间 类 型 相关 的 情况 , 所 以 在 给 定 静态 贝 叶 斯 博弈 的 定义 时 
我 们 考虑 到 这 种 情况 , 仍 把 参与 者 的 推断 写 为 pleie)? 

在 我 们 已 熟悉 的 完全 静态 页 叶 斯 博弈 的 标准 式 表 述 中 加 鞋 类 型 和 推断 
这 两 个 新 概念 ,就 可 得 到 静态 贝 叶 斯 博弈 的 标准 式 玫 述 。 


定义 — n 人 静态 贝 叶 斯 博弈 的 标准 式 表 述 包 括 : 戎 与 者 的 行动 空 
E Ai An 它们 的 类 型 空间 Ty, Ty 他 们 的 推断 pi,… pa 以 及 他 们 
的 收益 函数 uy :un。 参与 者 i 的 类 型 作为 参与 者 的 私人 信息 ,决定 了 
参与 者 i 的 收益 函数 , uta1,…an;t;) 并 且 晨 可 能 的 类 型 集 Ti 中 的 一 个 元 
Ko SSA i 的 推断 p.(:_:1z;) 描 述 了 i 在 给 定 自己 的 类 型 1; 时 . 对 其 他 
nn 一 1 个 参与 者 可 能 的 类 型 - ;的 不 确定 性 。 我 们 用 G= 1A1,…, Ani Tas 
oy Tad Bis Debts oo, ty | ERIN, 


根据 豪 尔 绍 尼 (1967) 的 假定 , WR AS DLO HE3 A BT PP T : (1) 6 
RETER ETIR =l Pe, 属于 可 行 集合 T;; (2) 
自然 告知 参与 者 ; 自己 的 类 型 ,, 却 不 告诉 其 他 参与 者 的 类 型 ;(3) 和 参与 者 
同时 选择 行动 ,每 一 参与 者 i 从 可 行 集 A; 中 选择 a;;(4) 各 方 得 到 收益 wi 
(a an;ti)。 人 借助 于 第 一 步 和 第 二 步 中 虚构 的 参与 者 “自然 "的 行动 ,我 
们 可 以 把 一 个 非 完全 信息 的 博弈 表述 为 一 个 不 完美 信息 的 博弈 . 其 中 非 完 
美 信息 的 含义 (参见 第 2 章 ) 为 在 博弈 的 某 些 行动 中 , 行动 方 不 知道 这 以 前 
的 博弈 进行 的 整个 过 程 。 这 里 , 因为 在 第 二 步 自 然 告知 了 参与 者 i 自己 的 
类 型 , 却 没有 告知 参与 者 ;, 在 第 三 阶段 参与 者 ; 选择 行动 时 ,j 就 不 知道 整 
个 的 博弈 进行 过 程 。 

在 讨论 静态 贝 叶 斯 博 穿 的 标准 式 表述 的 最 后 , 还 要 提 到 两 个 技术 性 较 
强 的 问题 。 第 一 ,在 有 的 博弈 中 , 参与 者 i 不 仅 对 他 自己 的 收益 函数 掌握 私 
人 信息 ,还 享有 其 他 参与 者 收益 函数 的 私人 信息 。 例 如 在 习题 3.2 中 ,对 第 
3.1.A 市 非 对 称 信息 古 诺 模 型 加 以 修改 ,使 两 企业 成 本 情况 完全 一 致 ,但 一 
个 企业 掌握 市 场 需求 水 平 , 另 一 企业 却 不 清楚 。 由 于 需求 水 平 可 以 影响 两 


O ”设想 有 两 个 企业 正比 赛 开发 一 项 新 的 技术 。 每 一 企业 成 功 的 宙 会 部 分 依 束 于 此 项 技术 的 
难度 , 这 一 点 是 未 知 的 。 每 一 企业 只 知道 自己 是 否 已 经 成 功 , 而 不 知道 另 一 企业 进展 如 何 。 不 过 , 
和 如果 企业 1 成功 耳 . 则 此 项 技术 的 难度 可 能 不 太 大 ,企业 2 同样 已 经 成 功 的 可 能 性 较 大 。 那 么 , 企 
业 1 对 企业 2 类 型 的 推断 是 依 束 于 企业 1 对 自己 类 型 的 知识 。 
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个 企业 的 收益 函数 , 知道 市 场 需求 的 企业 的 类 型 也 就 进入 了 另 一 企业 的 收 
ROR. En 个 参与 者 的 博弈 中 .我 们 允许 参与 者 i 的 收益 不 仅 决定 于 行 
动 组 合 (a1, …,aw), 还 决定 于 所 有 的 类 型 (ta,…，,tn), 从 而 包含 了 这 一 可 能 
情况 ,并 据 此 把 收益 函数 表示 为 ni(al anti ta)o 

第 二 个 技术 性 问题 涉及 到 推断 p(t -;1z;)。 我 们 将 假定 在 静态 贝 叶 斯 
博弈 时 间 顺 上 序 的 第 一 步 , 即 自然 根据 先 验 的 概率 分 布 p(z) 赋 了 各 参与 者 类 
型 向 量 1 = (11,…, 5) ,是 共同 知识 。 当 随后 自然 告知 参与 者 ; RM, 
于 ,他 可 以 根据 贝 叶 斯 法 则 计算 其 他 参与 者 类 型 的 条 件 概率 , 得 出 推断 p 


(eila)? 


Plot)_ PU-ot) 

Pe) |B pln ti 
而 且 , 另外 参与 者 根据 i 的 类 型 , 也 能 够 计算 参与 者 ; 持 有 的 不 同 推断 , 即 
MT 中 的 每 一 个 ,都 可 计算 出 p(t -;1#)。 前 面 已 经 提 到 ,我们 将 经 常 
假定 参与 者 的 类 型 是 相互 独立 的 , 这 时 加 (: -;) 不 再 依 束 于 ,但 仍 得 自 先 
验 分 布 p(z), 这 种 情况 下 ,其 他 参与 者 知道 参与 者 i 对 他 们 类 型 所 持 有 的 
推断 。 


3.1.C 轴 叶 斯 纳什 均衡 的 定义 


本 节 我 们 定义 静态 贝 叶 斯 博弈 的 一 个 均衡 概念 。 为 此 , 必须 首先 定义 
此 类 博弈 中 参与 者 的 战略 空间 。 第 2.3.B 和 第 2.4.B 节 已 经 讲 过 , 参与 者 
的 一 个 战略 是 关于 行动 的 一 个 完整 计划 , 包括 了 参与 者 在 可 能 会 遇 到 的 每 
一 种 情况 下 将 选择 的 可 行 行动 。 在 给 定 的 静态 贝 叶 斯 博弈 的 时 间 烦 序 中 ， 
自然 首先 行动 , 赋予 每 一 参与 者 各 自 的 类 型 ,参与 者 ; 的 一 个 ( 纯 ) 战 略 必须 
包括 参与 者 i 在 每 一 可 行 的 类 型 下 选择 的 一 个 可 行 行 动 。 


ple lt)= 


定义 ”在 静态 贝 叶 斯 博弈 G = 1A An Tits Tas P1 Past 
unul PESK i 的 一 个 战略 是 一 个 函数 s(t), 其 中 对 Ti 中 的 每 一 
类 型 5 AAT ARRET ;的 类 型 为 Bh, i 将 从 可 行 集 A; 中 选择 的 


O MERRET P(A18) 的 计算 公式 , 即 事件 日 已 经 发 生 后 ,事件 各 将 会 发 生 的 (条 侍 ? 
概率 。 令 P(A)、P(B) 及 P(A,B) 分 别 表 示 A 将 发 生 , B 将 发 生 , AB 都 将 发 生 的 ( 先 验 ) 概 率 ( 即 
不 论 4 还 是 B 者 没 有 机 会 发 生 之 前 的 概率 ), 只 时 斯 法 则 给 出 的 条 件 释 率 公式 为 PLA1B)= PCA, 
B)/P(B), 也 就 是 说 ,给 定 B 发 生 , A 发 生 的 条 件 鬼 率 等 于 A WB 同时 发 生 的 概率 除 以 B 发 生 的 
ERAK. 
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行动 。 


不 同 于 (静态 及 动态 的 ?完全 信息 博弈 , 在 册 叶 斯 博弈 的 标准 式 表 述 中 
没有 给 出 参与 考 的 战略 空间 。 作 为 替代 , 在 静态 贝 叶 斯 博弈 中 战略 空间 可 
从 类 型 空间 与 行动 空间 中 构建 :参与 者 i 的 可 行 的 ( 纯 ) 战 略 集 S 是 定义 域 
为 Ti, 值 域 为 A; 的 所 有 可 能 的 函数 集 。 例 如 一 个 分 离 战略 (separating 
strategy), T; 中 的 每 一 类 型” 都 选择 A; 中 的 不 同行 动 a;; 而 在 混同 战略 
(pooling sttategy) 中 ,所 有 的 类 型 都 选择 同一 行动 ,分 离 战略 和 混同 战略 的 
这 种 区 别 在 第 4 章 讨论 非 完 全 信息 动态 博弈 时 十 分 重要 , 在 这 里 提 到 这 两 
个 概念 的 区 分 ,只 是 帮助 说 明 从 给 定 的 类 型 空间 T, 和 行动 空间 A, 中 , 可 以 
构建 出 多 么 宽泛 而 又 差异 巨大 的 战略 。 

也 许 有 人 认为 ,要 求 参与 者 i 的 战略 包含 参与 者 i 每 一 种 可 能 类 型 下 
的 可 行 行 动 没有 必要 ,上 毕竟, 一 旦 自然 赋 于 某 参 与 者 一 特定 类 型 并 告知 他 ， 
参与 者 隋 不 必 再 关心 如 果 自 然 左 于 他 的 是 另外 一 种 类 型 他 将 如 何 行动 了 。 
但 另 一 方面 ,参与 者 i 还 需要 考虑 另外 的 参与 者 将 如 何 行 动 , 而 且 另外 参与 
者 的 行动 又 决定 于 他 们 对 参与 者 AT, 中 每 一 类 型 5 时 , i 的 行动 的 推 
断 。 从 而 , 在 被 赋予 某 种 类 型 之 后 要 决定 如 何 行动 , 参与 者 i 仍 必须 考虑 如 
果 他 被 赋予 工 ; 中 另外 每 一 所 时 应 该 如 何 行动 。 

作为 例子 ,考虑 第 3.1.A 节 中 的 非 对 称 信 息 古 诺 博弈 , 我 们 已 经 说 明 
博弈 的 解 由 三 个 产量 选择 组 成 :ez Con), 92 (cL) 及 gi? 。 用 刚刚 给 出 的 闫 
于 战略 的 定义 , (gq2 Con), a? (cL)) 就 是 企业 2 的 战略 , g? 是 企业 1 的 战 
略 , 很 容易 想到 企业 2 根据 自己 的 蕊 本 情况 会 选择 不 同 的 产量 ,但 是 还 应 注 
意 到 的 同样 重要 的 一 点 ,是 企业 1 在 选择 单一 的 产 出 时 也 应 同样 考虑 企业 
2 将 根据 不 同 的 成 本 选择 不 同 的 产量 。 从 而 , 如 果 我 们 的 均衡 概念 要 求 企 
业 1 的 战略 是 企业 2 战略 的 最 优 反 应 , 则 2 的 战略 必须 是 一 对 产量 , 分别 对 
应 于 两 种 可 能 的 成 本 类 型 , 否则 企业 1 就 无 法 计算 它 的 战略 是 否 确实 是 企 
业 2 战略 的 最 优 反应 。 

更 为 一 般 地 讲 , 如果 我 们 人 允许 一 个 参与 者 的 战略 不 包括 自然 赋予 他 其 
他 类 型 时 该 参与 者 将 选择 的 行动 ,我们 就 无 法 把 纳什 均衡 的 概念 运用 到 由 
时 斯 博弈 。 这 一 结论 和 第 2 章 的 一 个 结论 是 一 致 的 :在 完全 信息 动态 博弈 
中 ,看 似 没 有 必要 要 求 参与 者 i 的 战略 包含 参与 者 i 在 可 能 会 遇 到 的 所 有 
情况 下 的 行动 选择 ,但 如 果 我 们 允许 参与 者 的 一 个 战略 不 包含 革 些 可 能 明 
到 的 情况 下 的 行动 选择 ,我 们 就 无 法 把 纳什 均衡 的 概念 运用 于 完全 信息 动 
TEF. 
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Bh DLO TSE PGF ME AE E, 我 们 就 可 以 定义 贝 叶 斯 纳什 
均衡 了 。 尽 管 定义 中 的 符号 十 分 复杂 ,但 中 心思 路 却 既 简单 又 热 悉 :每 一 参 
与 者 的 战略 必须 是 其 他 参与 者 战略 的 最 优 反 应 , 亦 即 贝 叶 斯 纳什 均衡 实 标 
上 就 是 在 贝 叶 斯 博弈 中 的 纳什 均衡 。 


定义 ”在 静态 贝 叶 斯 博弈 G = 1A1,… Ani Ties Tai Bae tts Paiti 


中 ,战略 组 合 s" = ( 弛 5) 是 一 个 纯 战 略 贝 叶 斯 纳什 均衡 ,如 果 
对 每 一 参与 者 i 及 对 的 类 型 集 T 中 的 每 一 上 sr (1;) 满 足 
max Rs mg (së Ct1)p oa si (tin), aes soe terre Sa Cent) 


总 全 由 
pilta; lt). 

PH, 没有 参与 者 愿意 改变 自 己 的 战略 ， 即使 这 种 改变 只 涉及 一 种 类 型 下 的 

一 个 行动 。 


一 个 有 限 的 静态 贝 叶 斯 博弈 ( 即 铺 弈 中 n 是 有 限 的 ,并 且 (Ab C An) 
和 (Tt,…,T,) 都 是 有 限 集 ?存在 贝 叶 斯 纳什 均衡 ,也 许 包含 了 混合 战略 , 它 
的 证 明 十 分 容易 。 证 明 过 程 与 完全 信息 下 有 限 博 弈 中 混合 战略 纳什 均衡 存 
在 性 的 证 明基 本 一 致 ,本 书 略 去 。 


3.2 应 用 举例 


3.2.A RRA 


我 们 在 第 1.3.A 节 已 提 到 , 豪 尔 绍 尼 (1973) 提 出 参与 者 7 的 混合 战略 
代表 了 参与 者 i 对 i 所 选择 的 纯 战 略 的 不 确定 性 , 而 的 选择 又 依赖 于 他 所 
掌握 的 一 小 点 几 私 人 信息 。 现 在 ,我们 可 以 给 出 这 种 观点 的 精确 表述 :完全 
信息 博弈 的 混合 战略 纳什 均衡 (几乎 总 是 ) 可 以 解释 为 与 之 密切 相关 、 存 在 
一 小 点 非 完全 信息 的 博弈 中 的 纯 战 略 贝 叶 斯 纳什 均衡 (我 们 忽 栈 不 能 够 由 
此 解释 的 极为 罕见 的 情况 )。 用 更 容易 理解 的 话 讲 , 混合 战略 纳什 均衡 的 重 
要 特征 , 不 是 参与 者 j 随机 地 选择 一 个 战略 ,而 是 参与 者 i 不 能 确定 j 的 选 
择 ,这 种 不 确定 性 既 可 产生 于 随机 因素 , 又 可 能 (更 为 合理 地 ) 因 为 一 小 点 儿 
私人 信息 , 如 下 面 的 例子 。 

ERR 1 章 所 讲 的 性 别 战 博 弈 ,存在 两 个 纯 战 略 纳什 均衡 (歌剧 , 歌剧 ) 
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ACB, FH) R—NES RM, 其 中 克 里 斯 以 2/3 的 概率 选择 歌 
剧 . 柏 特 以 2/3 的 概率 选择 拳击 。 


ae 
歌剧 拳击 
歌剧 2,1 0,0 
AER 
at 0,0 1,2 


性 别 战 


现在 假设 尽管 两 人 已 经 认识 了 相当 一 段 时 间 , 但 克 里 斯 和 四 特 仍 不 能 
确定 对 方 收益 函数 的 情况 。 具 体 地 说 , 假定 如 果 双 方 都 选择 歌剧 克 里 斯 的 
收益 为 2+ 志 ,其 中 z 的 值 是 克 里 斯 的 私人 信息 , 双方 都 去 观看 拳击 时 帕 特 
的 收益 为 2+ 4, 其 中 cy 的 值 为 帕 特 的 私人 信息 ;zc 和 zs 相互 独立 ,并 服从 
(0, z+] 区 间 上 的 均匀 分 布 ( 至 于 选择 [0, x ] 区 间 的 均匀 分 布 并 不 重要 , 只 要 
记 住 上 和 te 的 值 是 指 原 博弈 收益 的 随机 扰动 项 , 我 们 可 以 认为 x 是 一 个 
很 小 的 正 数 )。 听 有 其 他 情况 下 的 监 益 不 变 。 表 述 为 标准 式 则 为 :静态 贝 计 
斯 博弈 G = 14., Ags Ter Tp Per Pp uo tp 中 ,行动 空间 为 A. = A, = | 歌 
Bl, dil, 类 型 空间 为 T,= T,= [0, x], 关于 类 型 的 推断 为 对 所 有 的 e 和 
tpr Pel(tp) = pelt) = Ux 收益 情况 如 下 图 。 

t 


歌剧 拳击 


Me | 24607 0,0 
举 击 0,0 1,24t, 


克 里 斯 


非 完全 信息 性 别 战 


我 们 将 构建 出 这 一 非 完 全 信息 性 别 战 博弈 的 纯 战 略 员 叶 斯 纳什 均衡 ， 
其 中 克 里 斯 在 i 超过 某 临 界 值 c 时 选择 歌剧 , 否则 选择 拳击 ; 帕 特 在 t, BL 
过 某 临界 值 疡 时 选择 拳击 , 否则 选择 歌剧 。 在 这 一 均衡 中 , 克 里 斯 以 (x - 
0)/z 的 概率 选择 歌剧 , 帕 特 则 以 (> - p)/z 的 概率 选择 拳击 。 我 们 将 证 明 
MZAA EENAA = 的 值 趋 于 0), 参与 者 在 这 一 纯 战略 贝 叶 
斯 纳什 均衡 中 的 行为 , 逐 源 与 原 博弈 完全 信息 条 件 下 混合 战略 纳什 均衡 中 
的 行为 相 一 致 ,也 就 是 随 z 的 值 趋 于 0,(z 一 c)/z 及 (z - p)/z 都 将 趋 于 
2/30 


EIE HReewAR Ni 


ABE Fe EU A AR EA H ARRE, 对 一 个 给 定 的 ,我 们 计 
SOBEL c Mp, 以 使 双方 的 战略 符合 贝 叶 斯 纳什 均衡 的 条 件 。 给 定 帕 特 
的 战略 , 克 里 斯 选择 歌剧 和 选择 源 击 的 期 望 收益 分 别 为 


2eosey+h-F) 052244) 
x id En 


5 
之 .0+[!- 之 ].4=1- 之 . 
= x z 
AT, 当 且 仅 当 
te> 广 -3 一 < (3.2.1) 


时 选择 歌剧 是 最 优 的 。 相 似 地 , 给 定 克 里 斯 的 战略 , AR EE chy FFE MK 
剧 的 期 望 收 益 分 别 为 


[17E] 0+ 2+ p) =E (2+) 
与 


£1. Lanata 
f1-F)-1+F-0=1-= . 


从 而 , 当 且 仅 当 
tp>E-3= (3.2.2) 


时 , WotR ER o 

解 (3.2.1) 和 (3.2.2) 构 成 的 方程 组 可 得 p=c 及 p*?+3p 一 x=0。 解 
此 二 次 方程 .可 得 到 克 里 斯 选 择 歌剧 的 概率 , 即 (z 一 c)/z, 以 及 帕 特 选 择 源 
击 的 概率 , 即 (z - p)/z, 都 等 了 


1 _ 一 3+ .9 了 4 


22 下 
当 工 趋 于 0 时 ,该 式 的 值 趋 于 2/3。 也 就 是 说 , 随 非 完 全 信息 的 消失 ， 
参与 者 在 此 非 完 全 信息 博弈 纯 战略 贝 叶 斯 纳什 均衡 下 的 行动 趋 于 其 在 不 完 
全 信息 博 蛮 混合 战略 纳什 均衡 下 的 行动 。 


3.2.B 拍卖 一 种 


考 虚 如 下 的 价格 优先 密封 拍卖 (first-price，sealed-bid auctiony。 有 两 个 
PRA (bidder), 分别 为 1、2, 投标 人 i 对 商品 的 估价 为 vj 一 一 即 如 果 投 标 
人 付出 价格 p 得 到 商品 , 风 i 的 收益 为 w - pp。 两 个 投标 人 的 估价 相互 


is} 
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独立 ,并 服从 [0.1] 区 间 上 的 均匀 分 布 。 投 标价 格 不 能 为 负 , 且 双 方 同时 给 
出 各 自 的 投标 价 。 出 价 较 高 的 一 方 得 到 商品 , 并 支付 他 报 的 价格 ; 另 一 方 的 
收益 和 支付 都 为 0。 在 投标 价 相等 的 情况 下 , ME Ay OE ee. BR 
方 是 风险 中 性 的 ,所 有 以 上 都 是 共同 信息 。 

为 把 这 一 问题 化 为 标准 式 的 静态 贝 叶 斯 博弈 , 我 们 必须 确定 行动 空间 、 
类 型 空间 、 推 断 及 收益 西数 。 参 与 者 i 的 行动 是 给 出 一 个 ( 非 负 的 ) 投 标价 
bia 其 类 型 即 他 的 佑 价 v;( 在 抽象 博弈 G = 141, Az Ti, Tas pi, pases uzl 
中 表示 为 , 行动 空间 A = [0, %), 类 型 空间 Ti = [0,11)。 由 于 估价 是 相互 
独立 的 , 参与 者 i 推断 vj 服从 [9,1] 区 间 上 的 均匀 分 布 ,而 不 依赖 于 mm 的 
值 。 最 后 , 参与 者 i 的 收益 函数 为 


vi- by 4b >b, ， 
witb 6231, v2) = (Cv; 6/2 4 b,=); 5 
0 EEAS A 


为 推导 这 一 博弈 的 贝 叶 斯 纳什 均衡 , 我 们 首先 建立 参与 者 的 战略 空间 。 
前 面 已 讲 过 ,在 静态 贝 叶 斯 博弈 中 , 一 个 战略 是 由 类 型 到 行动 的 函数 。 从 
而 ,参与 者 i 的 一 个 战略 为 函数 5,( vw;), 据 此 可 以 决定 i 在 每 一 种 类 型 ( 即 
对 商品 的 估价 ) 下 选择 的 投标 价格 。 在 贝 叶 斯 纳什 均衡 下 , 参与 者 1 的 战略 
51(U1) 为 参与 者 2 的 战略 52《 v2) 的 最 优 反 应 ,反之 亦 然 。 正 式 地, 战略 组 
合 (5(v4),6(v2)) 是 贝 叶 斯 纳什 均衡 , 如果 对 [0, 11 中 的 每 一 ve bilo) 
满足 


max( v, — bi)Probl b; >b; Coj) } + Elo; = b )Probl b; = Co)i . 


我 们 假设 该 问题 的 一 组 线性 均衡 解 bt(vi)= ait+ciol 及 balo) =a 
+ c2v2, 并 据 此 对 上 式 进行 简化 。 但 应 注意 我 们 不 是 限制 了 参与 者 的 战略 
空间 ,使 之 只 包含 了 线性 战略 ;而 是 允许 参与 者 任意 地 选择 战略 , 而 只 看 是 
香 存 在 线性 的 均衡 解 。 我 们 会 发 现 由 于 参与 者 的 估价 是 均匀 分 布 的 , 这 样 
的 线性 均衡 解 不 仅 存 在 , 而 且 是 惟一 的 (为 精确 起见 )。 其 结果 为 blos 
vi/2, 也 就 是 说 ,每 一 参与 者 以 其 对 座 品 估价 的 1/2 作为 投标 价 。 这 样 ,一 
个 投标 价格 反映 出 投标 方 在 拍卖 中 遇 到 的 最 基本 的 得 失 权衡 :投标 价格 越 
高 , 中 标的 可 能 性 越 大 ;投标 价格 越 低 ,一 旦 中 标 所 得 的 收益 就 越 大 。 

假设 参与 者 j ERRE bloj) = a, + cjvwj, 对 一 个 给 定 的 w 值 ,参与 者 
i 的 最 优 反应 为 下 式 的 解 

max(v; — b))Probtb; > aj + cot - 
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其 中 我 们 用 到 b: = ov, ARH 0 1X —HK( Probl b; = bj] =0, AW b; 
(oj) =a; + cv; 有 目 w 服 从 均 名 分布, 所 以 b; 也 服从 均匀 分 布 )。 由 于 i 的 
投标 价 低 于 参与 者 ; 最 低 的 可 能 投标 价格 没有 意义 , 而 高 于 ; 最 高 的 可 能 
BURT HS BRR RE, 我 们 有 Gta + cj, 于 是 
biza 


bi- i 
Prob] b; >a; + cwil = Probl v; < — fij ee . 
j 


从 而 参与 者 主 的 最 优 反应 为 
(a; + aj/2 当 naj, 
ua. 
如 果 0<a;<1, 则 一 定 存 在 茶 些 v; 的 值 ,使 v; < aj, 这 时 bl vw) 就 不 可 能 是 
线性 的 了 ,而 在 开始 时 呈 平 直 , 后 半 段 开始 倾斜 。 由 于 我 们 要 寻找 线性 的 均 
衡 ,就 可 以 排除 0<aj<<1, 而 只 讨论 a >1 Ba, <0 的 情况 。 但 前 一 种 情况 
是 不 可 能 在 均衡 中 出 现 的 ,因为 估价 较 高 一 方 对 投标 价 的 最 优选 择 是 不 低 
于 估价 较 低 一 方 的 投标 价 , 我 们 有 c, 220, 但 这 时 aw 产 1 便 意味 着 4,(v,) > 
邮 * 面 这 肯定 不 会 是 最 优 的 。 因 此 ,如 果 要 求 b (o) REN, 则 一 定 有 a, 
<0, 这 种 情况 下 b; (o) = (w+ aj)/2, 于 是 可 得 ai=aj/2 及 ci 一 1/2。 

我 们 可 以 假定 参与 者 i 采取 战略 bilo) = ai + cw, 对 参与 者 j 重复 上 
面 的 分 析 , 得 到 类 似 的 结果 a, 志 0, aj = as/2 以 及 c= 1/2。 解 这 两 组 结果 
构成 的 方程 组 ,可 得 a; = a;=0 和 c;= c;=1/2。 亦 即 前 面 所 讲 的 b; (o) = 
vf. 

也 许 有 人 会 关心 在 此 博弈 中 是 否 还 存在 另外 的 贝 叶 斯 纳什 均衡 , 以 
及 如 果 投 标 方 估价 的 概率 分 布 发 生变 化 ,均衡 的 投标 价格 将 如 何 变化 ， 
这 两 个 同 题 都 不 能 应 用 前 面 的 方法 { 即 先 假定 一 个 线性 战略 , 再 推导 出 
使 战略 符合 均衡 条 件 的 系数 ) 得 到 解答 :试图 猜测 这 一 搏弈 其 他 均 了 衡 中 
的 函数 形式 是 徒劳 的 ,并且 当 估价 服从 任何 其 他 分 布 时 , 线性 均衡 也 不 
存在 。 在 本 节 的 附录 中 , 我 们 推导 一 种 对 称 的 贝 叶 斯 纳什 均衡 ,了 但 仍 
然 是 在 估价 服 内 均匀 分 布 的 条 件 下 。 在 参与 者 战略 严格 递增 及 可 徽 的 
假定 下 , 我 们 证 明 惟 一 的 对 称 贝 叶 斯 纳什 均衡 就 是 本 节 推 导出 的 线性 均 
衡 。 我 们 所 运用 的 技术 方法 可 十 分 容易 地 扩展 到 较 广 类 型 的 估价 分 布 , 以 


btwi)= 


个 ” 当 参 与 者 的 战略 相同 时 , 贝 叶 斯 纳什 均 策 就 被 称 为 是 对 称 的 。 也 就 是 说 , 在 一 个 对 称 的 幢 
叶 斯 秽 什 均衡 中 ,存在 一 个 单一 的 5{v;), 使 参与 者 1 的 战略 blf ui) 为 5(o1), 参 与 者 2 的 战略 b 
《v2) 为 5(v2) ,并且 此 单一 战略 是 其 自身 的 最 优 反 应 。 当 热 , 尽 管 双 方 都 运用 同一 战略 ,但 由 于 参 
与 者 的 估价 一 般 是 不 一 致 的 , 他 们 的 投标 价格 一 般 也 不 会 相同 。 
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及 两 个 以 上 投标 者 的 情况 .@ 

附录 3.2.B 

假设 参与 者 7 采取 战略 6('), 同时 候 定 5(') 严 格 递增 并 可 微 。 则 对 一 
个 给 定 的 值 vi, 参与 者 i 的 最 优 投标 价格 应 满足 

max( v; = Bb)Problb: >bCuj 4 . 

令 5 1(5j) 表 示 参 与 者 j 在 选择 投标 价格 时 一 定 持 有 的 估价 , 即 如 果 b; 
=6C vy), bb) = wy。 由 于 wi 服从 区 间 [0,1] 上 的 均匀 分 布 , 5: >b 
(wj) 的 概率 等 于 671(6.) > vw HMR, BELET blb) > v (Probi b; > 


5(o)}=Problb iC) > vw!l=671(6:))。 从 而 参与 者 i 最 优化 问题 的 一 
阶 条 件 为 


-Tn Cai bb (6)=0. 


上 面 的 一 阶 条 件 在 给 定投 标 方 i 的 估价 w 时 , 是 关于 投标 方 :对 投标 方 j 
的 战略 5(*) 最 优 反应 的 隐 函 数 。 如 果 要 使 5(. ) 成 为 对 称 的 贝 叶 斯 纳什 均 
E, 我 们 要 求 一 阶 条 件 的 解 应 该 等 于 b(n): 也 就 是 说 , 对 参与 者 i 每 一 可 
能 的 估价 , 投标 方 ; 都 不 希望 背离 战略 5(.), 只 要 投标 方 也 选择 同一 成 
略 。 为 加 入 这 一 要 求 ,我 们 用 5; =5(w;) 代 入 一 阶 条 件 ,得 

BBC) + (Co BODIE (0,))=0 « 


当然 ,5 1(&5 (wv;)) 就 是 v, WA alo (h(a) ) 1 db: = 1/6 (vw), 也 就 是 
W, dib b) db; 衡量 为 使 投标 价格 发 生 单位 变动 , 投标 方 i 的 估价 必 
须发 生 多 大 变化 ,而 1/6 (zz) 则 衡量 如 果 估 价 发 生 单位 变化 , 其 投标 价格 
将 随 之 发 生 多 大 变动 。 从 而 ,5(`) 必 须 满足 一 阶 微分 方程 


-v+ (o; bD) pey 


BLE ALR bo) 0; tbl) = ,微分 方程 等 式 的 左边 恰好 等 于 
4d18(wi)vil/dvi, 对 左右 两 方 同时 积分 得 

blo)w = Lva k, 
其 中 上 为 积分 常数 。 为 消除 2, 我 们 需要 一 个 边界 条 件 。 幸 运 的 是 .很 简单 
的 经 济 学 理性 就 提供 了 一 个 ;没有 参与 者 愿意 出 高 于 自己 估价 的 投标 价格 。 


D 跳 过 此 附录 将 不 会 影响 对 以 后 内 容 的 理解 。 
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从 而 , 我 们 要 求 对 所 有 的 vi, 都 有 6(v) 志 vi。 其 一 个 特例 是 当 0, =0 时 ， 
我 们 要 求 5(0) 志 0。 由 于 投标 价格 被 限制 为 非 负 ,这 意味 荐 5(0) =0, 于 是 
k =0, 并且 6(v,) = wi/2, 即 前 面 的 结论 。 


3.2.C 双向 拍卖 


下 面 我 们 考虑 买方 和 卖方 对 自已 的 估价 都 存在 私人 信息 的 情况 ,参见 
BES FA BRR (Chatterjee & Samuelson, 1983). (#E HA (Hall) mi 
尔 ,1984) 的 文献 中 ,买方 为 一 家 企业 , 卖方 为 一 个 工人 , 企业 知道 工 入 的 边 
际 产 出 ,工人 知道 他 自己 的 机 会 成 本 , 参见 习题 3.8)。 我 们 分 析 一 个 叫做 
双向 拍卖 的 交易 博弈 , 卖方 确定 一 个 卖 价 po 买方 同时 给 出 一 个 买 价 ps。 
如 果 pp MIB p= Che t 9,)/2 OTE RET, SUR ps < p,, 则 不 发 
生 交 易 。 

买方 对 标的 商品 的 估价 为 vo 卖方 的 估价 为 ve 双方 的 估价 都 是 私人 
信息 ,并 且 服 从 [0,1] 区 间 的 均 句 分布。 如果 买方 以 价格 p 购 得 商品 , 则 可 
获得 ww -二 的 效用 ;如 果 交 易 不 能 进行 , 买方 的 效果 为 0。 如果 卖方 以 价格 
户 售 出 商品 , 则 可 得 到 p- mw 的 效用 ;如 果 交 易 不 能 进行 ,卖方 的 效用 亦 为 
0( 双 方 的 效用 函数 都 是 衡量 因 交 易 而 带 来 的 效用 变化 , 如 果 交 易 没 有 发 生 ， 
则 双方 效用 均 没有 变化 。 我 们 也 可 以 把 卖方 效用 定义 为 ; 当 以 价格 p 成 交 
时 效用 为 pp, 交易 不 发 生 时 效用 为 w。 两 者 并 不 存在 实质 区 别 )。 

在 这 一 静态 贝 叶 斯 博弈 中 , 买方 的 一 个 战略 是 函数 ps《 ws), AT E 
方 在 每 一 可 能 的 类 型 下 将 会 给 出 的 买 价 。 相 似 地 , 卖方 的 一 个 战略 是 函数 
bio). 明确 了 卖方 在 不 同 的 估价 情况 下 将 出 的 卖 价 。 如 果 以 下 的 两 个 条 
件 成 立 ,战略 组 合 | ps( ws), p,(v》1 即 为 博弈 的 贝 叶 斯 纳什 均衡 :对 [0, 1] 区 
间 内 的 每 一 w, ps (vs) 应 满足 

max[ w ~ bot El plu.) | po p(w.)] a) be? pele UJ Probi p> p, Cn) (3.2.3) 
其 中 EL po)! pep. v TERT FERMER T, 卖方 价 
格 的 期 望 值 。 对 [0, 1] 区 间 的 每 一 v,, p vw,) 应 满足 


max [+ El esto} patos) pl - v, [Probl po v0) ps} (3.2.4) 


其 中 El plo) pelvs) 之 p,] 为 在 买方 价格 大 于 卖方 价格 p. 的 条 件 下 , E 
方 价格 的 期 望 值 。 

此 博弈 有 非常 多 的 贝 叶 斯 纳 作 均衡 , 作为 一 个 例子 ,考虑 下 面 的 单一 价 
格 均衡 , 即 如 果 交 易 发 生 , 交易 价格 就 只 是 单一 的 价格 。 对 区 间 [0,1] 上 的 
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许多 =, 令 买方 的 战略 为 :如 果 vo, IRE oc, 其 他 情况 下 出 价 为 0; 同 
时 令 卖 方 的 战略 为 :如 果 ws<z, 则 出 卖 价 为 =, 其 他 情况 下 出 卖 价 为 1。 给 
定 买 方 的 战略 ,卖方 只 能 在 以 价格 = 成 交 或 不 能 成 交 之 间 进 行 选择 , 这 样 
卖方 战略 就 是 买方 战略 的 最 优 反 应 , 因为 如 果 卖 方 的 估价 小 于 c, EEEE 
以 价格 z 成 交 ,而 不 希望 没有 交易 , 即 成 交 是 他 的 最 优 反应 ;反之 亦 然 。 相 
似 的 分 析 还 可 以 证 明 , 买 方 战略 也 是 卖方 战略 的 最 优 反应 , 从 而 可 证 明 上 述 
战略 为 博 蛮 的 一 个 下 叶 斯 纳什 均衡 。 在 这 一 均衡 结果 下 , 图 3.2.1 标 出 区 
域内 的 (ww) 组 合 都 会 发 生 交易 ;而 对 所 有 z 1H (v,, vs) 组 合 来 讲 ， 
交易 都 是 有 效率 的 , 但 图 中 阴影 部 分 虽 满 足 效 率 条 件 , 却 没有 发 生 交易 。 


3.2.1 


现在 我 们 推导 双向 拍卖 的 一 个 线性 的 贝 叶 斯 纳什 均衡 。 仍 如 上 节 强 调 
的 ,我 们 并 没有 限制 参与 者 的 战略 空间 , 使 之 只 包含 线性 战略 ;而 仍 允 许 参 
与 者 任意 选择 战略 ,看 是 否 存在 一 个 均衡 ,双方 战略 都 是 线性 的 。 除 单一 价 
格 均衡 和 线性 均衡 之 外 ,博弈 还 存在 许多 其 他 均衡 , 但 线性 均衡 有 着 有 趣 的 
效率 特性 , 我 们 将 在 后 面 进 行 分 析 。 

假设 卖方 的 战略 为 p,(w,) =a, + cus W p, 服从 区 间 [a,, a + es] 上 的 
均匀 分 布 ,于 是 (3.2.3) 可 化 为 

mx 去 1 和 + 总 名 二 $ 

由 上 式 的 一 阶 条 件 可 推出 


ete 


wje 


a, . (3.2.5) 
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从 而 , 如果 卖 方 选择 一 个 线性 战略 , 则 买方 的 最 优 反应 也 是 线性 的 ;相似 地 ， 
假设 买方 的 战略 为 pelos) = as + cove, W ps 服从 区 间 [ as, as + cs] 上 的 均 
匀 分 布 , 于 是 (3.2.4) 可 化 为 


max[ bi p.+ Pitataj. », p b 
P, 


由 上 式 的 一 阶 条 件 可 得 

p= 和 + 和 ast cs) - (3.2.6) 
也 就 是 说 , 如果 买 方 选 择 一 个 线性 战略 , 则 卖方 的 最 优 反应 也 是 线性 的 。 要 
使 参与 双方 的 线性 战略 成 为 彼此 战略 的 最 优 反 应 , 由 (3.2.5) 可 知 ce = 
2/3, ay = as/3, 由 (3.2.6) 可 知 c, 一 2/3，as = (as+ cs)/3。 那 么 ,线性 均衡 
战略 为 


polww) 一 名 vw+ 走 ， (3.2.7) 


p(w)= 之 w+ 十 (3.2.8) 

如 图 3.2.2 所 示 。 
前 面 讲 过 , 双向 拍卖 中 当 且 仅 当 ps 之 p, 才 发 生 交易 ,合并 (3.2.7) 和 
《3-2.8) 的 条 件 可 知 ,在 线性 均衡 中 , 当 且 仅 当 wv 之 w+ (1/4) 时 才 会 有 交 
JRE, 如 图 3.2.3 所 示 ( 与 图 3.2.3 的 表示 相 印 证 ,图 3.2.2 说 明了 卖方 


图 3.2.2 


128 FREE 


的 类 型 高 于 3/4 时 , 他 出 的 卖 价 超过 了 买方 的 最 高 可 能 出 价 pe) = 3/45 
并 且 买 方 的 类 型 低 于 1/4 时 , 他 出 的 买 价 低 于 卖方 的 最 低 可 能 要 价 p, (0) 
=1/4)。 


w= + 4) 


3.2.3 


比较 图 3.2.1 和 图 3.2.3, 它们 分 别 表示 出 在 单一 价格 均衡 及 线性 均 
BP, 交易 发 生 所 要 求 的 估价 组 合 。 在 这 两 种 情况 中 , 交易 的 潜在 价值 最 大 
时 (具体 地 讲 , 当 w=0 H vs = 1 时), 都 将 会 发 生 交 易 。 但 是 ,单一 价格 均 
稀 漏 过 了 一 些 有 价值 的 交易 (比如 v,=0 且 v。 =z-e, 其 中 e BRB DH 
ER), 而 且 还 包含 了 一 些 几乎 没有 什么 价值 的 交易 (比如 且 v= r-e H 
世 sz+s)。 相 反 , 在 线性 均衡 中 , 漏 过 了 所 有 价值 不 大 的 交易 , 只 包含 了 
价值 至 少 在 1/4 以 上 的 交易 。 这 表明 从 参与 者 可 得 到 的 期 望 获 益 的 角度 ， 
线性 均衡 要 优 于 单一 价格 均 奖 , 但 同时 还 需要 研究 是 否 存 在 另外 的 均 钱 ,其 
中 参与 者 福利 状况 要 更 好 。 

JEL PRR AN BERS BAF (Myerson & Satterthwaite, 19833 证 明 , 对 于 这 里 
考虑 的 估价 的 均匀 分 布 ,双向 拍卖 的 线性 均衡 中 参与 者 的 期 望 获 益 高 于 博 
弈 的 其 他 任何 贝 叶 斯 纳什 均衡 (包含 但 不 只 限于 单一 价格 均 密 )}。 这 意味 着 
在 双向 拍卖 中 .不 存在 这 样 的 贝 叶 斯 纳什 均衡 :交易 当 百 忆 当 有 效率 时 将 会 
发 生 { 即 当 且 仅 当 wo, 时 )。 他 们 同时 证 明 后 一 结果 相当 普遍 :如 果 vw。 
FER zy, y ERD A, w ERE x,, y,} 连 续 分 布 ,其 中 y > r Bo > 
xz;, 则 买方 和 卖方 之 间 不 存在 他 们 所 乐于 进行 的 讨价还价 博弈 , ERO A 


PIE #HASARP RMR 129 


纳什 均衡 中 , 当 且 仅 当 有 效率 时 交易 发 生 。 在 下 一 节 , 我 们 要 简要 介绍 如 何 
应 用 显示 原理 证 明 这 一 普遍 的 结果 。 作 为 对 本 节 的 总 结 , 我 们 把 这 一 结果 
基体 运用 于 谷 尔 和 拉 齐 尔 的 就 业 模型 : 邵 果 企业 有 关于 工人 边际 产 出 { m ) 
的 私人 信息, 工人 则 掌握 自己 机 会 成 本 (vw) 的 私人 信息 , 则 企业 和 工人 之 间 
不 存在 他 们 乐于 进行 的 讨价还价 博 赛 , 当 且 仅 当 雇佣 有 效率 ( 即 ome Sv 
达成 筷 佣 协议 。 


3.3 Sim RECThe Revelation Principle) 


显示 了 原理 在 贝 叶 斯 博弈 的 条 件 下 最 先 由 迈 尔 森 (1979) 提 出 (其 他 相关 
条 件 下 有 不 同学 者 也 提出 过 类 似 的 结果 ), 是 在 参与 者 掌握 私人 信息 时 进行 
博弈 设计 的 重要 工具 。 它 可 应 用 于 前 两 节 讲 过 的 拍卖 及 双边 贸易 问题 ,以 
及 其 他 很 多 类 似 的 问题 。 本 节 我们 先 给 出 并 证 明 静 态 贝 叶 斯 博弈 的 显示 原 
理 ( 将 证 明 结 果 扩展 到 包含 动态 贝 叶 斯 博弈 十 分 简单 )。 不 过 , 在 这 之 前 , 我 
们 简要 介绍 显示 原理 应 用 于 拍卖 及 双边 贸易 问题 中 时 所 起 的 作用 。 

考虑 卖方 希望 设计 一 个 拍卖 以 使 他 的 期 望 收入 最 大 化 ,逐一 列 出 卖方 
可 能 考虑 的 不 同 的 拍卖 方式 是 一 项 艰 扎 的 工作 , 例如 在 第 3.2.B 节 的 拍卖 
中 ,出 价 最 高 的 投标 方 付 钱 给 卖方 并 得 到 商品 , 但 还 存在 许多 其 他 可 能 。 如 
投标 方 可 能 还 需要 支付 一 定 的 进入 费用 , 更 为 一 般 地 ,一 些 失 败 的 投标 方 也 
不 得 不 付出 一 些 钱 ,其 数量 也 许 依赖 于 自己 和 其 他 人 的 投标 价格 。 另 外 , 卖 
方 也 可 能 会 制定 一 个 底价 一 一 慨 于 此 价格 的 投标 价 将 不 会 被 接受 。 其 他 情 
况 还 包括 ,物品 可 能 会 有 一 定 的 概率 卖 不 出 去 , 而 物品 的 确 卖 出 时 , 也 不 总 
是 卖 给 出 价 最 高 的 投标 方 。 

这 时 卖方 就 可 以 借助 于 显示 产 理 来 使 他 的 问题 得 到 非常 大 的 简化 ,这 
有 两 个 方面 。 第 一 ,卖方 可 以 将 其 分 析 集中 在 以 于 类 型 的 博弈: 

1. 投标 方 同时 声明 (也 许 是 不 诚实 的 ) 他 们 自己 的 类 型 ( 即 他 们 各 自 的 
估价 )。 投 标 方 i 可 以 自称 其 类 型 为 的 可 行 类 型 集 T; 中 的 任意 
Ti; 而 不 论 他 的 真实 类 型 o 是 什么 。 

2. 在 给 定 的 投标 方 的 声明 (ri,…rs) 下 , 投标 方 i Mairi. rw) 的 
概率 支付 zi( ri, …，, rec) 得 到 标的 物品 。 对 所 有 可 能 的 声明 组 合 
Const, te) AAR qil riss Tn) Hott ga CTi yz 之 和 必须 小 于 
或 等 于 1。 
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这 种 类 型 的 博弈 ( 即 每 一 参与 者 惟一 的 行动 就 是 宣布 自己 所 属 类 型 的 静态 
员 叶 斯 博弈 ) 称 为 直接 机 制 (direct mechanism). 

第 二 ,根据 显示 原理 , 卖方 又 可 以 把 分 析 集 中 到 这 祥 的 直接 机 制 , 其 中 
每 一 投标 方 实话 实说 构成 一 个 册 叶 斯 纳什 均衡 一 一 也 就 是 , 设计 适当 的 支 
IER bs Oe (Crs Tady TT) ts qa 
(rit AE SS i 的 均衡 战略 是 宣布 C) = +i, 对 每 一 T; 中 
的 2 都 是 如 此 。 实 话 实说 形成 中叶 斯 纳什 均衡 的 直接 机 制 叫 做 激励 相 容 
(incentive-compatiable). 

在 拍卖 设计 之 外 的 其 他 问题 上 , 显示 原理 同样 可 以 用 于 这 两 个 方面 。 
任何 贝 叶 斯 博弈 的 任何 贝 叶 斯 纳什 均衡 都 可 以 重新 表示 为 经 过 适当 设计 的 
一 个 新 的 贝 叶 斯 博弈 的 新 的 贝 叶 斯 纳什 均衡 ,这 里 的 “重新 表示 "我 们 指 对 
每 一 可 能 的 参与 者 的 类 型 组 合 (tt …，*tr) ,新 的 均衡 下 参与 者 的 行动 和 收 
益 与 昌 的 均衡 下 完全 相同 。 不 论 原 博弈 是 什么 样子 , 新 的 贝 叶 斯 博弈 总 是 
一 个 直接 机 制 。 更 为 正式 地 : 


定理 {显示 原理 ) ”任何 贝 叶 斯 博 蛮 的 任何 贝 时 斯 纳什 均衡 , 都 可 以 重 
新 表示 为 一 个 激励 相 容 的 直接 机 制 。 


在 第 3.2.B 节 分 析 的 拍卖 中 , RAL LR YO A Ot A, 同时 
还 假定 (暗含 于 对 投标 方 估 价 的 定义 之 中 ) 知 道 投标 方 了 的 估价 并 不 会 改变 
投标 方 i 的 估价 (尽管 这 往往 会 改变 i 的 投标 价格 )。 我 们 把 这 两 个 假定 所 
表达 的 特点 归纳 为 投标 方 的 估价 相互 独立 ,并 且 是 各 自 的 私人 信息 。 对 这 
样 的 情况 , RR (1981) 计 算出 了 什么 样 的 直接 视 制 有 实话 实说 的 均衡 
并 且 哪 一 个 均衡 可 以 使 卖方 的 期 望 收 益 最 大 化 。 显 示 原 理 又 保证 了 没有 另 
外 的 拍卖 机制 ,其 中 叶 斯 纳什 均衡 可 以 使 卖方 得 到 更 高 的 期 望 收益 ,因为 这 
祥 的 拍卖 机 制 下 这 祥 的 均衡 已 经 被 重新 表示 为 一 个 直接 机 制 中 的 一 个 实话 
实说 均衡 , 并 且 所 有 这 祥 的 激励 相 容 的 直接 机 制 都 已 考虑 在 内 了 。 迈 尔 森 
同时 还 证 明了 第 3.2.B 节 中 分 析 的 拍卖 中 对 称 贝 叶 斯 纳什 均衡 就 相当 于 
这 里 的 收益 最 大 化 实话 实说 均衡 (正如 许多 其 他 常见 拍卖 博弈 中 的 对 称 均 
PED. 

作为 显示 原理 在 拍卖 中 应 用 的 第 二 个 例子 ,考虑 第 3.2.C 节 描 述 的 双 
边贸 易 问题 , 我 们 分 析 了 买卖 双方 可 能 会 选择 进行 的 一 种 交易 博弈 一 一 双 
向 拍卖 。 在 那里 ,如 果 交 易 发 生 , 则 买方 会 支付 一 些 钱 给 卖方 ,而 如 果 交 易 
不 能 发 生 , 则 也 没有 支付 ,但 同样 还 存在 许多 其 他 可 能 情况 。 比 如 , 即使 交 
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ATRE, 也 可 能 会 有 支付 (从 买方 向 卖方 , 或 者 相反 ), 或 者 交易 发 生 的 概 
率 严 格 地 在 0 和 1 之 间 (0、1 间 的 开 区 间 ); 还 有 , 决定 交易 是 否 发 生 的 条 件 
可 能 会 要 求 买 方 的 出 价 高 出 卖方 要 价 特定 幅度 ( 正 的 或 负 的 ), 而 这 一 幅度 
甚至 还 可 以 依 双 方 出 价 不 同 而 变动 。 

我 们 可 以 通过 以 下 类 型 的 直接 机 制 把 所 有 这 些 可 能 性 都 考虑 进去 : 买 
方 和 卖方 同时 就 各 自 的 类 型 作出 声明 , 表示 为 mw 和 上 r:, 之 后 买方 支付 给 卖 
H alts, t), BERTE A EEE A A fa, LA (cs, rs) 的 概率 获得 物品 。 迈 
尔 森 和 萨 特 思 韦 特 推导 出 什么 样 的 直接 机 制 有 实话 实说 均衡 , 并 且 提 出 了 
双方 在 每 一 种 类 型 下 愿意 参加 博弈 的 约束 条 件 ( 即 双方 在 每 一 种 类 型 下 均 
衡 的 期 望 收 益 不 低 于 该 种 类 型 拒绝 参加 时 可 得 到 的 收益 一 一 具体 地 说 , 拒 
绝 参 加 时 ,买方 的 每 一 类 型 w 和 卖方 的 每 一 类 型 z 的 收益 都 为 0)。 最 后 ， 
他 们 还 证 明 所 有 激励 相 容 的 直接 机 制 都 不 能 达到 交易 当 且 仅 当 有 效率 时 肯 
定 发 生 的 概率 为 1。 从 而 显示 原理 也 保证 了 不 存在 这 样 的 双方 都 乐于 参加 
的 讨价还价 博 蛮 , 在 其 贝 叶 斯 纳什 均衡 中 ,. 当 且 仅 当 有 效率 时 交易 发 生 。 

为 给 出 显示 原理 的 正式 表述 及 其 证 明 , 在 静态 贝 叶 斯 博弈 G = 1 Ay, 
en Ani Titt Ts Pis te Paiti “s tini P, ZERRA Hs” = 
《Ts )。 我 们 将 构建 一 个 有 着 实话 实说 均衡 的 直接 机 制 来 重新 表示 
s"。 符 合 条 件 的 直接 机 制 是 一 个 静态 贝 叶 斯 博弈 ,和 G 有 相同 的 类 型 空 
闻 和 推断 ,但 其 行动 空间 和 收益 函数 却 不 一 样 。 新 的 行动 空间 非常 简单 , 直 
接 机 制 中 参与 者 i 的 可 行 行 动 就 是 (可 能 是 不 诚实 地 ) 声 明 ; 的 所 属 类 型 ， 
这 就 是 说 ,参与 者 i 的 行动 空间 为 Ti。 新 的 收益 函数 就 复杂 多 了 , 它们 不 
仅 决 定 于 原 博弈 G, 还 决定 于 不 博 弈 的 均衡 ;* 。 问 题 的 关键 在 于 运用 G 
的 均 人 衡 解 :来 保证 实话 实说 是 直接 机 制 的 均衡 解 , 具体 证 明 步骤 如 下 。 

说 * 是 G 的 一 个 列 叶 斯 纳什 均 寅 ,意味 着 对 每 一 参与 者 i, s? 为 对 
其 他 参与 者 战略 (57 ，…,s 汪 1 5 让 4.…,s”) 的 最 优 反 应 。 更 为 具体 地 ,对 i 
的 每 一 种 类 型 1,€ Tas: (1:), 都 是 i 对 给 定 其 他 参与 者 的 战略 为 (s? ,…， 
sisie esa DAL, AK A; 中 选择 的 最 优 行动 。 那 么 , 如果 i 的 类 型 为 1， 
并 且 我 们 允许 i MA, 中 包含 * (4;) 的 一 个 于 集中 选择 行动 ,仍然 假定 其 他 
参与 者 的 战略 为 (57 sii sit sa), W i 的 最 优选 择 仍 为 5? (2;)。 
选 定 直接 机 制 中 的 收益 函数 时 , 就 是 设法 使 每 一 参与 者 面临 和 上 面相 同 的 
选择 。 

确定 直接 机 制 中 收益 函数 的 方法 如 下 :首先 将 新 博 罕 中 参与 者 关于 类 
型 的 声明 == (ri,… ,rs) 代 入 原 博弈 中 的 均衡 战略 s" ,然后 将 求 得 的 原 博 
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弈 的 均衡 行动 *" (e) = (sf Cri), sn Ce, RAE i eB, H 
公式 表示 ,i 的 收益 函数 为 

ole, t)= wls* Cr), £], 
HP t= (tr to 之 所 以 会 得 到 这 样 的 收益 函数 , 我 们 可 以 设想 为 ”个 
局 外 人 在 各 参与 方 之 间 进 行 联 系 , 开 作 内 容 如 下 的 谈话: 

我 知道 你 们 都 知道 自己 的 类 型 ,并 且 准 备 在 博弈 G 中 选择 均衡 战略 
s"。 我 希望 你 们 参加 一 个 新 的 博弈 , 即 直接 机 制 。 首 先 , 你 们 每 一 个 人 都 要 
签订 一 份 合约 , 允许 以 后 再 进行 博弈 G 时 由 我 指定 你 们 的 行动 ;第 二 , 你 们 
每 一 个 人 都 写 出 对 自己 类 型 的 声明 rmi, 并 交 给 我 ;第 三 ,我 会 用 每 个 参与 者 
在 新 博弈 中 声明 的 类 型 r, 代入 原 博弈 参与 者 的 均衡 战略 ,计算 出 如 果 
参与 者 的 类 型 真 的 是 n 时 , EIS s” 中 将 会 如 何 行 动 也 就 是 s? 
(zi)。 最 后 , 我 将 指定 你 们 每 一 个 人 选择 我 为 你 们 计算 出 的 行动 ,并 且 你 们 
会 得 到 这 一 结果 带 来 的 收益 ( 它 依赖 于 每 人 的 行动 与 你 们 真实 的 类 型 }。 

本 节 的 最 后 , 为 完成 对 显示 原理 的 证 明 , 我 们 证 明 实话 实说 是 构建 出 的 
直接 机 制 的 中 叶 斯 纳什 均衡 。 通 过 声明 自己 的 类 型 , E T,, 参与 者 i 事实 
上 就 等 于 从 4, 中 选择 了 行动 *” (ri)。 如果 所 有 其 他 参与 者 都 实话 实说 , 则 
他 们 事实 上 等 于 选择 了 战略 (5 了，…、s ?1 s 训 4，…,s*#* )。 但 前 面 我 们 已 经 
证 明 , 如 果 他 们 选择 了 这 样 的 战略 , 则 当 i Re, 时 , i 可 选择 的 最 优 
行动 为 *” (5), 那么 ,如 果 其 他 参与 者 实话 实说 , 则 当 i 的 类 型 为 5 时 ,他 的 
最 优选 择 就 是 声明 自己 的 类 型 为 no EAEN, 实话 实说 是 一 个 均衡 解 。 
更 为 正式 地 , 在 静态 员 叶 斯 博弈 1 Ts Tas Ta Tas Pas ts Pa? Vas e 
va} 中 ,对 TT 中 的 每 一 种 4, 每 一 参与 者 ; 选择 实话 实说 战略 T(z) = t 构 
成 一 个 只 叶 斯 纳什 均衡 。 


3.4 进一步 阅读 


近 尔 森 (1985) 对 贝 叶 斯 博 蛮 、 灵 叶 斯 纳什 均衡 及 显示 原理 提供 了 更 为 
详细 的 介绍 。 麦 卡 非 (McAfee) 和 坡 克 米 伦 (1987) 的 论文 对 拍卖 文献 作 了 
一 个 很 好 的 综述 .包括 对 优胜 者 的 诅咒 (winner's curse) 的 介绍 。 布 阁 和 克 
ERE (Bulow & Klemperer，1991) 把 第 3.2-B 节 的 拍卖 模型 进行 了 扩 
展 , 对 (比如 说 ) 房 产 市 场 中 理性 的 疯狂 及 崩溃 提供 了 一 个 颇具 说 服 力 的 解 
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释 。 关 于 非 对 称 信息 下 的 就 业 , 参见 过 尔 Deere, 1988) 分 析 的 一 个 动态 模 
型 ,其 中 工人 在 一 定时 间 内 顺序 向 一 系列 企业 求职 , 每 一 企业 都 作为 私人 入 
息 了 解 工人 的 边际 产 出 。 关 于 显示 原理 的 应 用 , 参见 巴 伦 (Baron) 和 迈 尔 森 
政府 对 不 了 解 成 本 情况 的 柳 断 企业 进行 规制 的 模型 , 喻 特 (Hart，1983) 关 
于 隐 含 合约 及 非 自 愿 失业 的 分 析 , 及 萨 平 顿 (Sappington 1983) 的 代理 理 
论 。 


3.5 习题 与 练习 


第 3.1 节 

3.1 ”什么 是 静态 贝 叶 斯 博弈 ? 什么 是 静态 贝 叶 斯 博弈 的 一 个 ( 纯 ) 战 
B? 什么 是 它 的 ( 纯 战略 ) 贝 叶 斯 纳什 均衡 ? 

3.2 考虑 下 面 的 古 诺 双 头 垄断 模型 。 市 场 的 反 需求 函数 为 p(Q)=a 
-QEF Q= gi+ gs 为 市 场 总 产量 。 两 个 企业 的 总 成 本 都 为 c; (9) = 
cq 但 需求 却 不 确定 :分 别 以 6 的 概率 为 高 (a = ay), 以 1 一 9 的 概率 为 尾 
{a = ar)。 还 有 ,信息 也 是 非 对 称 的 :企业 1 知道 需求 是 高 还 是 低 , 但 企业 2 
不 知道 。 所 有 这 些 都 是 共同 知识 。 两 企业 同时 进行 产量 决策 。 请 确定 这 两 
个 企业 的 战略 空间 ? 假定 aya. 和 < 的 取 值 范围 使 得 所 有 均衡 产 出 都 
是 正 数 ,此 博弈 的 贝 叶 斯 纳什 均衡 是 什么 ? 

3.3 考虑 下 面 的 贝 兰 特 德 双 头 垄断 模型 在 非 对 称 信息 下 的 情况 ,两 企 
业 的 产品 存在 差异 。 对 企业 i 的 需求 为 qi( pis 思 ) =a- pi- bi pj AEk 
的 成 本 都 为 0。 企 业 i 的 需求 对 企业 j 价格 的 敏感 程度 有 可 能 较 高 , 也 可 能 
BUR, 也 就 是 说 , 5; 可 能 等 于 br, 也 可 能 等 于 并, 这 里 bn > B51 >0。 对 每 一 
个 企业 , b= by 的 概率 为 9, b: = 6, 的 概率 为 1- 9, 并 与 5 的 值 无 关 。 每 
一 企业 知道 自己 的 &;, 但 不 知道 对 方 的 ,所 有 这 些 都 是 共同 知识 。 此 博弈 
中 的 行动 空间 、 类 型 空间 、 椎 断 以 及 效用 函数 各 是 什么 ? 双方 的 战略 空间 各 
是 什么 ? 此 博弈 对 称 的 纯 战 略 贝 叶 斯 纳什 均衡 应 满足 哪些 条 件 ? 求 出 这 样 
的 均衡 解 。 

3.4 ”在 下 面 的 静态 贝 叶 斯 博弈 中 , 求 出 所 有 的 纯 战 略 贝 叶 斯 纳什 均 
i: 

1. 自然 决定 收益 情况 由 博弈 1 给 出 , 还 是 由 博弈 2 给 出 ,选择 每 一 博 

弈 的 概率 相等 ; 


134 RC BR 


N 


, 参与 者 1 了 解 到 自然 是 选择 了 博弈 1, 还 是 选择 了 博弈 2, 但 参与 者 
2 不 知道 ; 

- 参与 者 1 选择 相等 TRB, 同时 参与 者 2 选择 上 RR; 

. 根据 自然 选择 的 博弈 , 两 参与 者 得 到 相应 的 收益 。 


a w 


博弈 1 博弈 2 


第 3.2 节 

3.5 USS 1.3 节 我 们 曾 讲 过 的 猜 硬币 博 弃 (属于 完全 信息 静态 博 
弈 ) 不 存在 纯 战略 纳什 均衡 ,但 有 一 个 混合 战略 纳什 均衡 :每 个 参与 者 都 以 
1/2 的 概率 选择 出 正面 。 


参与 者 2 


正面 背面 


正面 l-1 -1,1 
背面 -1,1 i, -1 


HSARA Hae BE ZE fa AEE, R — ARa T a 5 
E, ERZAR BATNAR, AAE R FT 
在 原 完 全 信息 博弈 中 混合 战略 纳什 均衡 下 的 行为 。 

3.6 考虑 一 个 价格 优先 密封 拍卖 , 其 中 投标 方 的 估价 相互 独立 , 并 服 
从 区 也 [0,1] 上 的 均匀 分 布 。 证 明 如 果 有 凡 个 投标 方 , 则 以 各 自 估 价 的 (= 
一 1)/n 倍 作为 投标 价格 是 这 一 拍卖 的 一 个 对 称 贝 叶 斯 纳什 均衡 。 

3.7 BRAIAS) 把 第 3.2.C 节 分 析 的 双向 拍卖 的 买方 和 卖 
方 的 角色 作 了 改动 ,分 别 代 之 以 企业 和 工人 , 其 中 企业 知道 工人 的 边际 产 出 
(mx), 工 人 知道 自己 的 机 会 成 本 (wv)。 在 这 种 情况 下 , 交易 意味 着 工人 被 企 
业 所 雇佣 , 双方 交易 的 价格 就 是 工人 的 工资 w。 如 果 发 生 了 交易 , 则 企业 
的 收益 为 m- w, 工人 的 收益 为 w ;如 果 不 发 生 交 易 , 则 企业 的 收益 为 0, 工 
人 的 收益 为 v。 

和 前 面相 同 , BE m 和 相互 独立 ,服从 区 间 [0,1] 上 的 均匀 分 布 。 为 
了 进行 比较 ,计算 双向 拍卖 中 双方 参与 者 在 线性 均衡 下 的 期 望 收益 。 并 改 
变 双向 拍卖 的 条 件 , 考虑 如 下 两 个 交易 博弈 : 


参与 者 1 
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博弈 了 ;在 双方 了 解 到 各 自 的 私人 信息 之 前 , 他 们 先 订立 一 份 合 约 , 规 
定 如 果 工 人 被 企业 所 雇佣 , 则 工人 的 工资 为 w, 但 同时 任何 一 方 都 可 以 无 
成 本 地 解除 雇佣 关系 。 在 双方 了 解 到 各 自 的 私人 信息 后 , 他 们 同时 宣布 是 
接受 工资 v 还 是 拒绝 。 如 果 双 方 都 宣布 接受 , 则 交易 发 生 ; 否则 交易 不 能 
发 生 。 对 给 定 的 [0, 1] 之 间 的 任意 w, 此 博弈 的 贝 叶 斯 纳什 均衡 是 什么 ? 
参照 图 3.2.3 的 方式 ,表示 出 交易 发 生 的 类 型 组 合 。 求 出 使 双方 参与 者 期 
望 收益 之 和 最 大 的 w 值 ,并 求 出 这 时 的 期 望 收益 之 和 。 

博弈 互 : 在 了 解 到 各 自 的 私人 信息 之 前 ,双方 签订 一 份 合约 , 规定 将 运 
用 以 下 的 动态 博弈 来 决定 工人 是 否 加 入 企业 , 及 一 旦 加 入 时 的 工资 水 平 ( 严 
格 地 说 ,这 里 的 博弈 属于 第 4 章 的 内 容 。 我 们 将 合并 运用 本 章 及 第 2 章 讲 
到 的 知识 ,求解 此 博弈 , 从 而 也 可 以 起 到 温 故 而 知 新 的 作用 )。 在 双方 了 解 
到 各 自 的 私人 信息 之 后 ,企业 向 工人 开 出 工资 水 平 ww, 工 人 既 可 以 接受 , 也 
可 拒绝 。 试 着 用 逆向 归纳 法 分 析 这 一 博弈 。 请 参考 第 2.1.A 节 对 完全 信 
息 博弈 进行 的 类 似 分 析 , 可 沿 以 下 的 思路 :对 给 定 的 w 和 ,工人 将 如 何 选 
择 ? 如 果 企 业 预 测 到 工人 的 选择 , 对 给 定 的 m, 企业 又 将 如 何 决策 ? 这 时 双 
方 参与 者 的 期 望 收益 之 和 是 多 少 ? 
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第 4 章 


非 完全 信 息 动 态 博弈 


本 章 我 份 将 介绍 另 一 种 新 的 均衡 概念 一 精炼 由 时 斯 均衡 , 从 而 在 这 
四 章 中 就 有 了 四 个 均衡 概念 :完全 信息 静态 博弈 中 的 纳什 均衡 、 完 全 信息 动 
态 博 弈 中 的 子 博 弈 精炼 纳什 均衡 . 非 完全 信息 静态 博弈 中 的 贝 叶 斯 纳什 均 
衡 以 及 非 完 全 信息 动态 博弈 中 的 精炼 贝 叶 斯 均衡 。 看 起 来 我 们 好 像 对 所 研 
究 的 每 一 类 型 的 博弈 都 发 明 出 了 一 种 新 的 均衡 概念 ,但 事实 上 这 些 概 念 又 
是 密切 相关 的 。 随 我 们 研究 的 博弈 逐步 复杂 , 我 们 对 均衡 概念 也 逐渐 强化 ， 
从 而 可 以 排除 复杂 博弈 中 不 合理 或 没有 意义 的 均衡 , 而 如 果 我 们 运用 适用 
于 简单 博弈 的 均衡 概念 就 无 法 区 分 。 在 每 一 种 情况 下 , 较 强 的 均衡 概念 只 
在 应 用 于 复杂 的 博弈 时 才 不 同 于 较 弱 的 均衡 概念 , 而 对 简单 的 博弈 并 没有 
区 别 。 具 体 地 说 ,精炼 贝 叶 斯 均 脆 在 非 完全 信息 静态 博弈 中 妈 等 同 于 贝 叶 
斯 纳什 均衡 , 在 完全 信息 动态 博弈 (以 及 在 许多 完全 非 完美 信息 动态 博弈 ， 
包括 第 2.2 节 及 第 2.3 节 诗 论 过 的 博弈 ) 中 等 同 于 子 博弈 精炼 纳什 均衡 , 在 
完全 信息 静态 博弈 中 等 同 于 纳什 均衡 。 

引入 精炼 贝 叶 斯 均衡 的 目的 是 为 了 进一步 强化 ( 即 加 强 对 条 件 的 要 求 》 
贝 叶 斯 纳什 均衡 ,这 和 子 博弈 精炼 纳什 均衡 强化 了 纳什 均衡 是 相同 的 。 正 
如 我 们 在 完全 信息 动态 博弈 中 加 上 了 子 博 弈 精炼 的 条 件 , 是 因为 纳什 均衡 
无 法 包含 威胁 和 承诺 都 应 是 可 信 的 这 一 思想 ;我 们 在 对 非 完 全 信息 动态 博 
蛮 的 分 析 中 将 集中 于 精炼 贝 叶 斯 均衡 , 是 因为 贝 叶 斯 纳什 均衡 也 存在 同样 
的 不 足 。 回 顾 前 面 讲 过 的 , 如果 参与 者 的 战略 要 成 为 一 个 子 博弈 精炼 纳什 
拘 衡 , 则 它们 不 仅 必 须 是 整个 博弈 的 纳什 均衡 , 还 必须 是 其 中 每 一 个 子 博弈 
的 纳什 均衡 。 在 本 章 中 , 我 们 用 更 为 广义 的 后 续 博 弈 (continuation game) 的 
概念 来 代 蔡 子 博弈 的 概念 一 一 前 者 可 始 于 任何 完全 信息 集 ( 而 不 论 是 否 单 
节 ), 不 再 仅 开始 于 单 节 的 信息 集 。 其 后 , 我 们 进行 相似 的 分 析 ; 如 果 参 与 者 
的 战略 要 成 为 博弈 的 一 个 精炼 贝 叶 斯 均衡 , 它们 不 仅 必 须 是 整个 博弈 的 忠 
叶 斯 纳什 均衡 , 而 且 还 必须 构成 每 一 个 后 续 博 弈 的 贝 叶 斯 纳什 均衡 。 
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在 第 4.1 节 我 们 一 般 性 地 介绍 精炼 贝 叶 斯 均衡 的 主要 特征 。 为 此 ,我 
们 暂时 采用 与 上 面 强调 的 内 容 相 反 的 第 二 (互补 的 ) 理 解 :精炼 贝 叶 斯 均衡 
通过 对 参与 者 推断 的 隐 含 的 分 析 , 强化 了 子 博 弈 精炼 纳什 均衡 的 要 求 , 这 也 
和 贝 叶 斯 纳什 均衡 是 相似 的 。 这 种 第 二 理解 首先 由 豪 尔 绍 尼 (1967) 提 出 ， 
因为 我 们 可 以 把 一 个 非 完全 信息 博弈 描述 为 一 个 非 完 美 信息 博弈 自然 
告知 参与 者 i 他 的 类 型 却 没有 告知 j, 于 是 参与 者 j 就 不 知道 博弈 进行 的 完 
ENE. kh, 一 种 为 在 非 完 全 信息 动态 博弈 中 强化 贝 叶 斯 纳什 均衡 而 设 
计 的 均衡 概念 ,同样 可 以 强化 完全 非 完美 信息 动态 博弈 中 的 子 博弈 精 卉 纳 
什 均衡 。 

在 第 4.2 节 我 们 分 析 非 完全 信息 条 件 下 应 用 最 广 的 博弈 类 型 :信号 博 
F (signaling game)。 用 抽象 的 语言 表述 ,信号 博弈 包含 两 个 参与 者 (其 中 之 
一 有 私人 信息 , 另 一 个 没有 ), 两 步行 动 (首先 由 掌握 私人 信息 的 一 方 发 出 一 
个 信号 , 然后 没有 私人 信息 的 一 方 作出 反应 )。 其 主要 思想 是 , 如 果 某 类 有 
私人 信息 的 参与 者 愿意 发 出 一 种 信号 ,而 另外 类 型 的 参与 者 因 成 本 太 高 无 
法 发 出 同样 的 信号 , 则 交流 就 可 达成 。 首 先 , 我 们 定义 信号 博弈 的 精炼 贝 叶 
斯 均衡 ,并 描述 可 能 存在 的 不 同 种 类 的 均衡 结果 (分 别 对 应 于 不 同 程度 的 交 
流 ,从 没有 交流 到 完美 交流 ) 。 其 后 ,考虑 斯 彭 斯 (Spence, 1973) 的 极 富 创 意 
的 就 业 市 场 信号 模型 , 以 及 迈 尔 斯 和 迈 卢 去 (Myers & Majluf, 1984) 的 公司 
投资 模型 和 维 克 斯 (Vickers, 1986) 的 货币 政策 模型 。 

在 第 4.3 节 我 们 讨论 精炼 贝 叶 斯 均衡 的 其 他 应 用 。 首 先 介 绍 克 劳 福 德 
和 索 贝 尔 (1982) 对 空谈 博弈 (cheap-talk game) 的 分 析 ( 即 所 有 的 信号 都 不 
需 任 何 成 本 的 信号 博弈 ) ,该 模型 的 应 用 包括 总 统 否决 权威 胁 、 联 邦 储备 委 
员 会 关于 货币 政策 的 表态 ,以 及 组 织 内 部 的 交流 (或 “声音 ”(voice))。 在 空 
REAP, 交流 的 程度 决定 于 参与 者 利益 在 多 大 程度 上 是 共同 的 , 而 不 在 于 
不 同类 型 参与 者 发 出 信号 的 成 本 差异 。 其 后 我 们 研究 案 贝 尔 和 高 桥 (1983) 
的 序 贯 谈判 模型 ,其 中 企业 必须 要 承受 一 次 黑 工 以 表明 它 无 法 支付 更 高 的 
工资 (比较 第 2.1.D 节 中 重 宾 斯 坦 的 完全 信息 谈判 模型 , 在 均 奖 情况 下 不 
会 出 现 黑 工 )。 最 后 , 我 们 将 介绍 克 雷 普 斯 米尔 格 龙 ( Milgrom)、 罗 伯 获 以 
及 威 尔 和 于 (1982) 等 人 十 分 重要 的 研究 结论 ,他 们 分 析 了 声誉 (Reputation) 在 
有 限 重复 的 囚徒 困境 中 达成 理性 合作 的 关键 作用 (参照 第 2.3.A 节 得 出 的 
结论 ,阶段 博弈 有 惟一 纳什 均 寅 的 有 限 重 复 博弈 ,有 惟一 的 子 博弈 精炼 纳什 
HA, 即 阶 段 博弈 的 编 什 均 福 重 复 n 次 )。 

在 第 4.4 节 重 回 理论 分 析 。 尽 管 是 本 书 的 最 后 一 节 , 但 它 更 多 地 指示 
博弈 论 的 发 展 方向 及 更 新 和 更 深入 的 研究 领域 , 而 不 只 是 对 以 前 内 容 的 总 
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其 中 第 二 个 是 赵 和 克 雷 普 斯 {Chao & Kreps, 1987) HY BW RAE (Intuitive 


Criterion}. 


4.1 精炼 贝 叶 斯 均衡 概述 


考 虚 如 下 完全 非 完 美 信息 动态 博弈 。 第 一 , 参与 者 1 在 3 个 行动 中 进 
行 选择 一 一 L 、M 及 尺 。 如 果 参 与 者 1 选择 R, 则 博弈 结束 (不 等 参与 者 2 
行动 )。 如 果 参 与 者 1 选择 了 工 或 M, 则 参与 者 2 就 会 知道 1 没有 选择 R 
《但 不 清楚 1 是 选择 了 上 ERM) AER LR R 两 个 行动 中 进行 选择 , 博 
弈 随 之 结束 。 收 益 情况 由 图 4-1.1 的 扩展 式 博弈 给 出 。 


图 4.1.1 


， 参 与 者 2 , 
L R 
L 2,1 9.0 
参与 者 1 MM 0,2 0.4 
R 1,3 1,3 

4.1.2 


通过 图 4.1.2 给 出 的 这 一 博弈 的 标准 式 表 述 , 我 们 可 以 发 现存 在 两 个 
纯 战 略 纳什 均衡 (I, L'} 和 (RR, R')。 为 确定 这 些 纳什 均衡 是 否 符合 子 博弈 
精炼 的 条 件 , 我 们 先 明 确 博 弈 的 子 博 弈 。 由 于 子 博 弈 根据 定义 始 于 单一 信 
息 集 的 次 策 节 (但 不 包含 博弈 的 第 一 个 决策 节 ), 图 4.1.1 里 的 博弈 不 存在 
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子 博弈 。 如 果 一 个 博弈 没有 子 博 蛮 , 则 子 博弈 精炼 的 要 求 ( 具 体 地 说 , 即 参 
与 者 的 战略 在 每 一 个 子 博 弈 中 均 构 成 纳什 均 衡 ) 自 然 就 得 到 满足 。 从 而 在 
任何 没有 子 博 弃 的 传 弈 中 , 子 搏弈 精炼 纳什 均衡 的 定义 便 等 同 于 纳什 均衡 
的 定义 ,于 是 在 图 4.1.1 中 , tL, ) 以 及 (R,R') 都 是 子 博弈 精炼 纳什 均 
fi. WHR, R' ) 却 又 明显 要 依赖 于 一 个 不 可 信和 的 威胁 :如 果 轮 到 参与 者 
2 行动 , 则 选择 L SAT MER’, 于 是 参与 者 1 便 不 会 由 于 2 威胁 他 将 在 
其 后 的 行动 中 选择 R, 而 去 选择 R, , 

使 均衡 概念 得 到 进一步 强化 ,以 排除 图 4.1.1 中 像 (R, R') 的 子 博弈 精 
烽 纳 什 均衡 的 方法 之 一 ,是 再 附加 以 下 两 个 要 求 。 

要 求 1: 在 每 一 信息 集中 ,应 该 行动 的 参与 者 必须 对 博弈 进行 到 该 信 
息 集中 的 哪个 节 有 一 个 推断 (belief)。 对 于 非 单 节 信 息 集 ,推断 是 在 信息 集 
中 不 同 节点 的 一 个 概率 分 布 ; 对 于 单 节 的 信息 集 , 参与 者 的 推断 就 是 到 达 此 
单一 决策 节 的 概率 为 1。 

要 求 2: 给 定 参 与 者 的 推断 , 参与 者 的 战略 必须 满足 序 贯 理性 (se- 
quentially raticnal) 的 要 求 。 即 在 每 一 信息 集中 应 该 行动 的 参与 者 (以 及 参 
与 者 随后 的 战略 》, 对 于 给 定 的 该 参与 者 在 此 信息 集中 的 推断 , 以 及 其 他 参 
与 者 随后 的 战略 (其 中 “随后 的 战略 "是 在 达到 给 定 的 信息 集 之 后 , 包括 了 其 
后 可 能 发 生 的 每 一 种 情况 的 完全 的 行动 计划 ) 必 须 是 最 优 反应 。 

在 图 4.1.1 中 ,要 求 1 意味 着 如 果 博 弈 的 进行 达到 参与 者 2 的 非 单 节 
信息 集 , 则 参与 者 2 必须 对 具体 到 达 哪 一 个 节 ( 也 就 是 参与 者 1 选择 了 工 
还 是 RR) 有 一 个 推断 。 这 样 的 推断 就 表示 为 到 达 两 个 节 的 概率 志和 1 p， 
见 图 4.1.3。 


4.1.3 


给 定 参 与 者 2 的 推断 , 选择 RMA aM ST p-O+ (1- p):1=1 


BAR ERIE DEIOH Idi 


-p WA LAB ae FT p+ (1-p)-2=2-p. HERE RA 
pP, 都 有 2- p>1— p, BEOR 2 ART 2 选择 R' 的 可 能 性 ,从 而 ,在 本 例 中 
简单 要 求 每 一 参与 者 持 有 一 个 推断 , 并且 在 此 推断 下 选择 最 优 行动 ,就 足以 
使 我 们 排除 不 合理 的 均衡 (R,R Jo 

要 求 1 和 2 只 保证 了 参与 者 持 有 推断 , 并 对 给 定 的 推断 选择 最 优 行动 ， 
但 并 没有 明确 这 些 推断 是 否 是 理性 的 。 为 进一步 约 东 参与 者 的 推断 , 我 们 
需要 区 分 处 于 均 交 路 答 上 的 信息 集 和 不 处 于 均 突 路径 上 的 信息 集 。 


定 凡 ”对 于 一 个 给 定 的 扩展 式 博弈 中 给 定 的 均衡 , 如 果 博 弈 根据 均衡 
战略 进行 时 将 以 正 的 概率 达到 某 信息 集 , 我 们 称 此 信息 集 处 于 均衡 路 径 之 上 
(on the equilibrium path)。 反 之 , 如 果 情 穿 根 据 均衡 战略 进行 时 , 肯定 不 会 达 
到 某 信息 集 , 我 们 称 之 为 处 于 均衡 路 径 之 外 的 信息 集 (off the equilibrium 
path)。{《 其 中 "均衡 "可 以 是 纳什 . 子 博弈 精 烽 、 贝 叶 斯 以 及 精炼 贝 叶 斯 均衡 》 


要 求 3: 在 处 于 均衡 路 径 之 上 的 信息 集中 , 推断 由 贝 叶 斯 法 则 及 参与 
者 的 均衡 战略 给 出 。 

例如 ,在 图 4.1.3 的 子 博 蛮 精炼 统 什 均衡 (L, 1 ) 中 ,参与 者 2 的 推断 
一 定 是 p = 1: 给 定 参与 者 1 的 均衡 战略 ( 具 性 地 说 , L), 参与 者 2 知道 已 经 
到 达 了 信息 集中 的 哪 一 个 节 。 作 为 要 求 3 的 另 一 种 说 明 ( 假 定性 的 ), 设想 
在 图 4.1.3 中 存在 一 个 混合 战略 均衡 , 其 中 参与 者 1 选择 工 的 概率 为 qu 
M 的 概率 为 gz, 选择 R 的 概率 为 1 一 g, 一 9。 要 求 3 则 强制 性 规定 参与 者 
2 的 推断 必须 为 p= g/g + 92)。 

要 求 1 到 3 包含 了 精炼 贝 叶 斯 均衡 的 主要 内 容 , 这 一 均 隐 概念 最 为 关 
键 的 新 的 特征 要 归功 于 克 雷 普 斯 和 威 尔 进 (1982) :在 均衡 的 定义 中 , 推断 被 
提高 到 和 战略 同等 重要 的 地 位 。 正 式 地 讲 , 一 个 均衡 不 再 只 是 由 每 个 参与 
者 的 一 个 战略 所 构成 ,还 包括 了 两 个 参与 者 在 该 他 行动 的 每 一 信息 集中 的 
一 个 推断 .了 通过 这 种 方式 使 参与 者 推断 得 以 明确 的 好 处 在 于 , 和 前 几 章 
中 我 们 强调 参与 者 选择 可 信 的 战略 一 样 , 现在 我 们 就 可 以 强调 参与 者 特有 


DFO A ETL AT FF RHM sequential equilbrium) 的 定 文 , 对 均衡 的 这 一 特点 进行 
TREAD, FRARI- MARS, ERS SHE eT OL, 但 某 些 请 
况 下 可 能 更 强 一 些 。 认 其 均衡 无 论 在 概念 上 , CEE PESER RSE ee e, TL 
大 多 数 教科 书 现在 都 使 用 后 者 了 。 还 有 一 些 使 用 精 展 贝 叶 斯 均 宛 的 作者 不精 殉 地 ) 称 为 序 贯 均 
Ao KERRIER, 任意 的 有 很 博弈 ( 即 所 有 有 限 参 与 者 .类 型 有 限 , 可 能 的 行动 步 数 有 限 
ETRE MA PF TO EE OTE PA EMR HAR 
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理性 的 推断 , 无论 是 处 于 均衡 路 径 之 上 (要 求 3), 还 是 处 于 均衡 路 径 之 外 
(后 面 的 要 求 4, 以 及 第 4.4 节 中 的 其 他 情况 )。 

在 简单 的 经 济 学 应 用 中 ,包括 第 4.2.A 节 的 信号 博弈 和 第 4.3.A 节 的 
空谈 博弈 一 一 要 求 1 到 3 不 仅 包 括 了 精炼 贝 叶 斯 博弈 的 主要 思想 , 而 且 还 构 
成 了 它 的 定义 。 不 过 , 在 更 为 复杂 的 经 济 学 应 用 中 , 为 删除 不 合理 的 均衡 ,还 
需 引 入 进一步 的 要 求 。 不 同 的 学 者 使 用 过 不 窜 的 精炼 贝 叶 斯 均 瞻 定义 ,所 有 
的 定义 都 包括 要 求 1 到 3, 绝 大 多 数 同时 包含 了 蔓 求 4; 还 有 的 引入 了 更 进 一 
步 的 要 求 。P 本 章 我 们 用 要 求 1 到 4 作为 精炼 贝 叶 斯 均衡 的 定义 .@ 

要 求 4: ”对 处 于 均衡 路 径 之 外 的 信息 集 , 推断 由 贝 叶 斯 法 则 以 及 可 能 
情况 下 的 参与 者 的 均衡 战略 决定 。 


定义 ”满足 要 求 1 到 4 的 战略 和 推断 构成 博弈 的 精炼 贝 叶 斯 均衡 。 


对 要 求 4 青 给 出 一 个 更 为 精确 的 表述 当然 会 有 助 于 我 们 理解 一 不 包 
含 较为 模糊 的 限定 语 “ 可 能 情况 下 ”, 在 其 后 各 节 的 经 济 学 应 用 分 析 中 我 们 
将 完成 此 项 工作 。 现 在 , 我 们 通过 图 4.1.4 和 4.1.5 中 的 三 位 参与 者 博弈 
来 说 明 并 理解 要 求 4 的 必要 性 (收益 值 中 , 上 、 中 、 下 分 别 表示 了 参与 者 1、 
2、3 的 收益 )。 

此 博弈 有 一 个 子 博 弈 : 它 始 于 参与 者 2 的 单 节 信息 集 。 这 一 子 博弈 ( 参 
与 者 2 和 3 之 间 的 ) 椎 一 的 纳什 均衡 为 ( 工 , R), 于 是 整个 博弈 惟一 的 子 博 
弈 精炼 纳什 均衡 为 ( 刀 , 上 ,R')。 这 一 组 战略 和 参与 者 3 的 推断 p= 1 满足 
了 要 求 1 到 要 求 3, 而 且 也 简单 地 满足 了 要 求 4, 因为 没有 处 于 这 一 均衡 路 
径 之 外 的 信息 集 , 于 是 构成 了 一 个 精炼 贝 叶 斯 均衡 。 

下 面 考虑 战略 (4, 上 ,二 ) 以 及 相应 的 推断 p =0。 这 组 战略 是 一 个 纳 
什 均衡 ,没有 参与 者 愿意 单独 偏离 这 一 结果 。 这 一 组 战略 及 推 扬 也 满足 要 


D ”为 使 谍 者 对 到 求 1 到 4 之 外 的 硒 素 有 一 点 概念 ,很 设 参 与 者 2 和 3 已 观测 到 同样 的 事件 . 
并 都 观察 到 参与 者 WRT HRA. ABSA 1 有 私人 信息 的 非 完 全 信息 博弈 中 , 参与 者 2 和 3 
是 否 还 应 对 参与 者 1 的 类 型 有 同样 的 推断 ? ERS EST, 参与 者 2 和 3 对 之 前 所 观察 到 的 
参与 者 1 的 行动 是 否 应 村 有 相同 的 推断 ? HL, URS S 2 : 和 3 已 观测 到 的 事件 相同 , 然后 参 
与 者 2 情 离 了 均衡 行动 ,参与 者 3 是 否 应 该 改变 他 对 参与 者 1 类 型 的 推 斯 , 或 改变 对 1 没 观察 到 的 
行动 的 推断 ? 

久富 登 伯 格 和 泰 动 尔 {1991) 对 非 完全 信息 动态 博 斌 更 为 广泛 的 种 类 给 出 了 精炼 贝 叶 斯 均衡 
的 正式 定义 。 他 们 的 定义 强调 了 注 中 中 提 到 的 因素 。 不 过 , 在 本 章 分 析 的 简单 博弈 中 ,此 类 因素 不 
会 被 涉及 到 。 所 以 ,他 们 的 定义 等 价 于 要 求 ! 到 4。 帘 侠 伯 格 和 蒂 罗 尔 还 给 出 了 其 精 坊 贝 时 斯 均衡 
等 价 于 交 奋 普 斯 和 威 尔 下 的 序 贯 均衡 的 条 件 。 
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4.1.4 


求 1 到 3, 参 与 者 3 有 一 个 推断 并 根据 它 选择 最 优 行动 。 但 是 ,这 一 纳什 均 
衡 却 不 是 于 博弈 精 炬 的 , 因为 博弈 惟一 子 博 弈 的 惟一 的 纳什 均衡 为 ( 工 ， 
民 "), 这 也 说 明 要 求 1 到 3 并 不 能 保证 参与 者 的 战略 是 子 博 弈 精 炬 纳什 均 
衡 。 问 题 在 于 参与 者 3 的 推断 (p =0) 与 参与 者 2 的 战略 ( 工 ) 并 不 一 致 , 但 
要 求 1 到 3 并 没有 对 3 的 推断 进行 任何 限制 , 因为 如 果 按 给 定 的 战略 进行 
博弈 将 不 会 到 达 3 的 信息 集 。 不 过 ,要求 4 强制 3 的 推 斯 决定 于 参与 者 2 
的 战略 :如 果 2 的 战略 为 工 , 则 3 的 推断 必须 为 p =1; 如 果 2 的 战略 为 
R, 则 3 的 推断 必须 为 p =0。 但 是 , 如果 3 的 推断 为 p =1, 则 要 求 2 又 
强制 3 的 战略 为 R', 于 是 战略 (A, 工 , L') 及 相应 推断 p =0 不 能 满足 要 
求 1 到 4。 

为 进一步 理解 要 求 4, 假设 图 4.1.4 稍 作 改变 成 为 图 4.1.5: 现 在 参与 
者 2 多 出 了 第 三 种 可 能 的 行动 A& ,也 可 以 令 博 弈 结束 (为 使 表示 简化 ,这 一 
博弈 略 去 了 收益 情况 )。 和 前 例 相 同 , 如果 参与 者 1 的 均衡 战略 为 A, 则 参 
与 者 3 的 信息 集 就 处 于 均衡 路 径 之 外 , 但 现在 要 求 4 却 无 法 从 2 的 战略 中 
决定 3 的 推断 。 如 果 2 的 战略 为 A, WER 4 就 对 3 的 推断 没有 任何 限 
制 ,但 如 果 2 的 战略 为 以 g 的 概率 选择 L, q 的 概率 选择 R, 1- qi- 92 的 
概率 选择 4A, 其中, 91 + 92 = 0, 则 要 求 4 就 限定 了 3 的 推断 为 p = gi/( gq 
+ 92) 

在 本 节 的 最 后 , 我们 非 正 式 地 讨论 精 震 贝 叶 斯 均衡 和 前 几 章 介绍 的 均 
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图 4.1.5 


衡 概念 的 关系 。 在 纳什 均衡 中 ， 每 一 参与 者 的 战略 必须 是 其 他 参与 者 战 
略 的 一 个 最 优 反应 ， 于 是 没有 参与 者 会 选择 严格 劣 战略 。 在 精炼 贝 叶 
斯 均衡 中 ， 要 求 1 和 2 事实 上 就 是 要 保证 没有 参与 者 的 战略 是 始 于 任 
何 一 个 信息 集 的 劣 战略 。( 参 见 第 4.4 节 给 出 的 始 于 一 个 信息 集 的 劣 战 
路 的 正式 定义 } 纳什 均衡 及 贝 叶 斯 纳什 均衡 对 处 于 均衡 路 径 之 外 的 信 
息 集 则 没有 这 方面 的 要 求 ， 即 使 是 子 博弈 精 炬 纳什 均衡 对 某 些 处 于 均 
衡 路 径 之 外 的 信息 集 也 没有 这 方面 的 要 求 ， 比 如 对 那些 不 包含 在 任何 
FRA WA BR. MMOH RAT RRB: 参与 者 不 可 以 
BBLS FL a AE AO ERORE RR, BA Sh GB E 
之 外 。 

正如 前 面 讲 过 的 ,精炼 贝 叶 斯 均衡 这 一 概念 的 优点 之 一 , 就 是 它 使 得 参 
与 者 的 推断 明确 化 了 ,从 而 使 我 们 可 以 引入 要 求 3 和 4 以 及 更 进一步 的 要 
求 (对 处 于 均衡 路 径 之 外 的 推断 )。 由 于 精 炬 页 叶 斯 均衡 排除 了 参与 者 ; 选 
择 任 何 始 于 处 于 均衡 路 径 之 外 信息 集 的 严 祝 劣 战略 的 可 能 性 , 要 令 参 与 者 
j 相信 i 会 选择 这 样 一 个 战略 当然 也 是 不 合 情 理 的 。 不 过 , 精炼 贝 叶 斯 均衡 
使 得 参与 者 的 推断 明确 化 了 。 这 种 均衡 往 往 不 能 沿 博弈 树 通 过 道 向 推导 而 
构建 出 来 , 像 我 们 构建 子 博 弈 精 烽 纳什 均衡 时 采用 的 方法 一 样 。 要 求 2 决 
定 了 参与 者 在 一 个 给 定 信息 集 的 行动 部 分 依赖 于 参与 者 在 该 信息 集 的 推 
B, 如 果 在 这 一 信息 集 还 同时 适用 于 要 求 3 或 者 要 求 4, 则 参与 者 的 推断 又 
由 其 他 参与 者 在 博弈 树 更 上 端的 行动 所 决定 。 但 是 根据 要 求 2, 这 些 在 博 
奔 树 更 上 端的 行动 又 部 分 依赖 于 参与 者 随后 的 战略 , 包括 在 当初 信息 集 的 
行动 。 这 一 循环 推论 意味 着 沿 博弈 树 从 后 向 前 逆向 推导 (一 般 铺 况 下 ) 将 不 
足以 计算 出 精炼 兄 叶 斯 均衡 。 
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4.2 信号 博弈 


4.2.A 信号 博弈 的 精炼 贡 叶 斯 均衡 


信和 号 博弈 是 两 个 参与 者 之 间 的 非 完全 信息 动态 博弈 :信号 发 送 者 
{Sender，S) 和 信号 接收 者 (Receiver，R), 博弈 的 时 间 顺 序 如 下 : 
1. 自然 根据 特定 的 概率 分 布 (za). 从 可 行 的 类 型 集 TH |e ot P 
赋予 发 送 者 某 种 类 型 o, 这 里 对 所 有 的 i;, p(t) >0 HE p(21) +… 
+ p(t =13 

2. 发 送 者 观测 到 1;, 然后 从 可 行 的 信号 集 M = | m1,…, mi 中 选择 一 
个 发 送信 号 mj; 

3. 接收 者 观测 到 zi( 但 不 能 观 出 到 4), 然后 从 可 行 的 行动 集 Aled, 
,at 中 选择 一 个 行动 ax; 

4. 双方 收益 分 别 由 w(t mj, as 和 udt, my, et) 给 出 。 

在 许多 应 用 中 , 可 行 集合 T、M 及 A 为 实数 轴 上 的 区 间 , 而 不 是 上 面 
考虑 的 有 限 集 。 而 允许 可 行 的 信号 集 依赖 于 自然 赋 于 的 类 型 , 可 行 的 行动 
集 又 依赖 于 发 送 者 选择 的 信号 的 情况 也 十 分 容易 理解 。 

入 号 模型 已 被 十 分 广泛 地 应 用 于 经 济 学 领域 。 为 说 明 其 潜在 应 用 的 广 
泛 性 , 我 们 把 将 在 第 4.2.B 和 第 4.2.C 节 分 析 的 三 个 应 用 套用 1 一 4 式 的 
规范 结构 简 述 如 下 : 

在 斯 茧 斯 (1973) 的 劳动 力 市 场 模 型 中 ,发 送 者 是 一 个 求职 的 工人 ， 
接收 者 是 潜在 的 雇主 市 场 ,类 型 为 工人 的 生产 能 力 , 信号 是 工人 对 教育 
的 选择 ,行动 是 市 场 支 付 的 工资 。 

在 迈 尔 斯 和 迈 卢 夫 (1984) 的 公司 投资 和 资本 结构 模型 中 , 发送 者 
为 要 为 一 个 新 项 目 融资 的 企业 , 接收 者 为 潜在 的 投资 者 ,类 型 为 现存 资 
产 的 大 利 能 力 ,信号 为 企业 为 所 融资 金 承 诺 的 权益 份额 ,行动 则 是 投资 
者 就 是 否 投资 作出 的 决定 。 

在 一 些 应 用 中 , 信号 博 弃 被 融 于 内 容 更 为 丰富 的 博弈 之 中 。 例 如 , 在 第 
二 步 发 送 者 选择 信和 号 之 前 , 接收 者 可 能 会 有 一 个 行动 ,或 是 在 第 四 步 接收 者 
选择 行动 之 后 (或 当时 ) 发 送 者 会 有 一 定 的 行动 。 

在 维 克 斯 (1986) 的 货币 政策 模型 中 , 联邦 储备 局 享有 的 私人 信息 
是 其 为 促进 就 业 而 愿意 接受 的 通货 膨胀 水 平 , 其 他 的 条 件 与 第 2.3.E 
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节 分 析 的 完全 信息 重复 博弈 完全 相同 , 不 过 只 包含 两 个 阶段 。 这 样 ,发 

送 者 为 联 情 当局 ,接收 者 为 就 业 市 场 .类 型 为 联储 为 促进 训 业 而 络 意 接 

受 的 通胀 水 平 , 信号 为 联储 对 第 一 期 通胀 的 选择 , 行动 为 户主 们 对 第 二 

期 通胀 的 预期 。 鹿 主 们 对 第 一 期 通胀 的 预期 发 生 在 信和 号 博弈 之 前 , 联 

储 对 第 二 期 通胀 水 平 的 选择 则 在 其 后 。 

本 节 的 其 余部 分 暂 不 分 析 上 面 列 举 的 应 用 模型 , 而 集中 研究 1 一 4 给 出 
的 抽签 的 信号 博弈 , 图 4.2.1 给 出 了 一 种 简单 情况 的 扩展 式 表 述 (不 考虑 收 
HWA): T= |t 021, M= |m mal, A= janaz, ,概率 Probltii = po 
注意 ,这 里 博弈 的 进行 并 不 是 从 树 的 最 上 端 初始 节 依次 到 最 下 端的 终点 节 ， 
而 是 从 树 中 间 自 然 的 初始 行动 依次 进行 到 左右 两 端的 终点 节 。 

前 面 已 讲 过 (在 任何 博弈 中 ) 参 与 者 的 一 个 战略 是 行动 的 完整 计划 一 一 
战略 包含 在 可 能 届 到 的 每 一 种 情况 下 参与 者 将 选择 的 行动 。 因 而 在 信号 博 
FP, 发送 者 的 一 个 纯 战 略 是 函数 m(1;) ,明确 发 送 者 为 自然 可 能 赋予 的 每 
一 种 类 型 时 ,将 选择 的 信号 ;接收 者 的 一 个 纯 战 略 则 是 函数 a (mj), 指明 对 
发 送 者 可 能 会 发 出 的 每 一 种 信号 将 选择 什么 行动 。 在 图 4.2:1 的 简单 博弈 
中 ,发 送 者 和 接收 者 都 有 四 个 纯 战 略 。 


t, 
发 送 者 


图 4.2.1 


发 送 者 战略 1: 如 果 自 然后 于 类 型 6, 选择 信号 m1; 如 果 自 然 赋 子 类 型 
to 选择 信号 mis 

发 送 者 战略 2M RARE 2. 选择 m1; 如 果 自 然 赋 巴 2, BE m 
发 送 者 战略 3: 如 果 自 然 赋予 cl. 选择 mo RB RE 02, HEHE mys 
发 送 者 战略 4: 如 果 自 然 赋 子 上 ,选择 ma MRR 2, 选择 mao 
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接收 者 战略 1: 如 果 发 送 者 选择 信号 m1, 选择 行动 a1; 如 果 发 送 者 选择 

信号 ma 选择 行动 a1; 

接收 者 战略 2: 如 果 发 送 者 选择 mp 选择 a1; 如 果 发 送 者 选择 my, 选 

ars 

接收 者 战略 3: 如 果 发 送 者 选择 me1, 选择 sz; 如果 发 送 者 选择 m2, 选 

ais 

接收 者 战略 4: 如 果 发 送 者 选择 mi, 选择 a2; 如 果 发 送 者 选择 ma, 选 

择 azo 

我 们 称 发 送 者 的 第 1 和 第 4 战略 为 混同 (pooling) 战 略 , 因为 在 不 同类 
型 时 都 发 出 相同 的 信号 。 在 多 于 两 种 类 型 的 模型 中 还 存在 部 分 混同 (par- 
tially pooling)( 准 分 离 (semi-separating)) 战 略 , 其 中 所 有 属于 给 定 类 型 集 的 
类 型 都 发 送 同样 的 信号 , 但 不 同 的 类 型 集 发 送 不 同 的 信号 。 在 图 4.2.1 的 
两 类 型 博弈 中 也 存在 与 混合 战略 相 类 似 的 战略 , 称 为 杂 合 战略 (hybrid 
strategies) : 比如 说 类 型 2, 选择 mi, (AZ AY 2. 却 随机 选择 m 或 m2。 

现在 ,我 们 把 第 4.1 节 中 关于 要 求 1 到 3 的 一 般 性 表述 转化 为 信号 博 
弈 中 对 精炼 贝 叶 斯 均衡 的 正式 定义 { 对 图 4.1.5 的 讨论 说 明了 要 求 4 对 信 
号 博弈 是 没有 意义 的 )。 为 使 问题 简化 , 我 们 只 讨论 纯 战 略 。 杂 合 战 略 在 下 
一 节 分 析 就 业 市 场 信号 时 再 给 以 简要 介绍 。 至 于 如 何 一 般 性 定义 信号 博弈 
中 的 贝 叶 斯 纳什 和 均衡, 我们 留 作 习题 ,请 自己 练习 ,参见 习题 4.6。 

因为 发 送 者 在 选择 信号 时 短 道 短 弈 进行 的 全 过 程 , 这 一 选择 发 生 于 单 
节 信 息 集 (对 自然 可 能 赋 于 的 每 一 种 类 型 都 存在 一 个 这 样 的 信息 集 )。 从 
而 ,要 求 1 在 应 用 于 发 送 者 时 就 元 需 附加 任何 条 件 ;相反 , 接收 者 在 不 知道 
发 送 者 类 型 的 条 件 下 观测 到 发 送 者 的 信号 ,并 选择 行动 , 也 就 是 说 接收 者 的 
选择 处 于 一 个 非 单 节 的 信息 集 (对 发 送 者 可 能 选择 的 每 一 种 信号 都 存在 一 
个 这 样 的 信息 集 , 而 且 每 一 个 这 样 的 信息 集中 , 各 有 一 个 节 对 应 于 自然 可 能 
赋 子 的 每 一 种 类 型 )。 把 要 求 1 应 用 于 接收 者 可 得 到 : 

信号 要 求 1 在 观测 到 M 中 的 任何 信号 mi 之 后 ,接收 者 必须 对 哪些 
类 型 可 能 会 发 送 m 持 有 一 个 推断 。 这 一 推断 用 概率 分 布 u(z | mi) 表 示 ， 
其 中 对 所 求 了 PH t, ulim) H 


Dult | m;)=1. 
“er 
给 定 发 送 者 的 信号 和 接收 者 的 推断 ,再 描述 接收 者 的 最 优 行为 便 十 分 简单 ， 


把 要 求 2 应 用 于 接收 者 可 以 得 到 : 
信号 要 求 2R 对 M 中 的 每 一 m;, 并 在 给 定 哪 些 类 型 可 能 发 送 mi 的 
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推断 u(t;| ey ) 的 条 件 下 ,接收 者 的 行动 = ( mj) 必须 使 接收 者 的 期 望 效用 
最 大 化 。 亦 即 a’ (m pH FRE 
masUs( ts mra "(mj)) 

要 求 2 同样 适用 于 发 送 痢 ,但 发 送 者 有 完全 信息 (及 由 此 而 来 的 单纯 推断 )， 
并 且 只 在 博弈 的 开始 时 行动 ,于 是 要 求 2 相对 比较 简单 :对 给 定 的 接收 者 的 
战略 , 发 送 者 的 战略 是 最 优 反应 ; 

信号 要 求 23 对 T 工 中 的 每 一 4 在 给 定 接收 者 惰 略 a"(m;) 的 条 件 
下 ,发 送 者 选择 的 信号 m” (#1) 必须 使 发 送 者 的 效用 最 大 化 。 亦 即 m” (a) 
为 下 式 的 解 


max Us(t;, mja” (mj)) . 


最 后 , 给 定 发 送 者 的 战略 mw" (z;), 令 T; 表示 选择 发 送 者 信号 mj 的 类 
型 集合 ,也 就 是 说 ,如 果 mC) =m, Ne, BT; 中 的 元 素 。 如 果 T; 不 是 
空 集 , 则 对 应 于 信号 m, 的 信息 集 就 处 于 均衡 路 径 之 上 ;否则 , 任何 类 型 都 
不 选择 mj, 其 对 应 的 信息 集 则 处 于 均衡 路 径 之 处 . 对 处 于 均衡 路 径 上 的 信 
号 , 把 要 求 3 运用 于 接收 者 的 推断 , 可 以 得 到 ; 

信号 要 求 3 对 每 一 M 中 的 m, WRA TREE, 使 得 m* (i:)= 
mj, 则 接收 者 在 对 应 了 mi 的 信息 集中 所 持 有 的 推断 必须 决定 于 贝 叶 斯 法 
则 和 发 送 者 的 战略 : 


we; | my) = S p(t)” 


EL AFRE AARRE SS RE m” Ce, ) 
a’ (mj) 以 及 推断 u(i) mj), 满足 信和 叶 要 求 (1), (2R),(2S) 及 (3)。 


如 果 发 送 者 的 战略 是 混 辐 的 或 分 高 的 ,我 们 就 称 均衡 分 别 为 混同 的 或 分 离 
的 。 

在 本 节 的 最 后 ,我 们 求解 图 4.2.2 中 两 类 型 博弈 的 纯 战略 精炼 贝 叶 斯 
均衡 。 请 注意 这 里 自然 赋予 每 一 类 型 的 可 能 性 是 相等 的 , 我 们 分 别 用 (Cp,1 
一 户 ) 和 (gq,1 一 g) 表 示 接 收 者 在 其 两 个 信息 集 内 的 推断 。 

这 一 两 类 型 .两 信号 博弈 有 4 个 可 能 的 纯 战 略 精 炼 贝 叶 斯 均衡 :(1) 泥 
同 于 工 ;(2) 混 同 于 R;(3) 分 离 , ea EL, zz 选择 尺 ; 及 (4) 分 离 , zl 选择 
R,t2 选择 上 。 我 们 依次 分 析 这 四 种 可 能 性 。 
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4.2.2 


1. 混同 于 工 :假设 存在 一 个 均衡 , 发 送 者 的 战略 为 ( 工 , 工 ), 这 里 (ne 人， 
zi ) 表 示 类 型 ! 选择 m ,类 型 tz 选择 mx”。 则 接收 者 对 应 于 L 的 信息 集 
处 于 均衡 路 径 之 上 ,于 是 接收 者 在 这 一 信息 集 内 的 推断 (z,1- p) REF I 
叶 斯 法 则 和 发 送 者 的 战略 :p=0.5, 也 就 是 先 验 分 布 。 给 定 这 样 的 推断 ( 事 
实 上 或 者 任何 其 他 推断 ), 接收 者 在 之 后 的 最 优 反应 为 选择 u, 于 是 类 型 
i 和 类 型 ts 的 发 送 者 分 别 可 得 到 的 收益 为 1 和 2。 为 确定 是 否 两 种 类 型 
的 发 送 者 都 愿意 选择 L, 我 们 需要 明确 对 R 接收 者 将 如 何 反 应 。 如 果 接 收 
者 对 R 的 反应 为 z, 则 类 型 nm 选择 R 的 收益 等 于 2, 它 高 于 选择 工 的 收 
ft 1。 但 如 果 接 收 者 对 R 的 反应 为 d, 则 通过 选择 R, ti 和 ,的 收益 将 (分 
别 ) 为 0 和 1, 而 他 们 选择 工 却 可 分 别 获得 1 和 2。 那么 , 如 果 存 在 一 个 均 
衡 , 其 中 发 送 者 的 战略 为 ( 工 , 荆 ), 则 接收 者 对 R 的 反应 必须 为 4, 于 是 接收 
者 的 战略 必须 为 (x, d), 这 里 (a', a”) 表 示 接 收 者 在 上 ZR’, ER 
之 后 选择 we"。 另 外 ,还 需要 考虑 接收 者 在 对 应 于 R 的 信息 集中 的 推断 , 以 
及 给 定 这 一 推 斯 时 选择 4 是 否 是 最 优 的 。 由 于 对 接收 者 当 g<2/3 时 选择 
d 为 最 优 的 , RITIRI, L), Ca, d), p=0.5, q], FEEN 9 委 273 为 博 
变 的 混同 精炼 贝 叶 斯 均衡 。 

2. 混同 于 R; FUE Re AY CR, R), Wg =0.5, 于 是 接收 
者 对 R 的 最 优 反应 为 4, 类 型 i 和 zo 分 别 得 到 的 收益 为 0 和 1。 但 e 选 
择 工 可 得 到 收益 1, 因 为 对 任意 p 值 ,接收 者 对 L 的 最 优 反应 都 是 ,于 是 
不 存在 发 送 者 战略 为 (RR, R ) 的 均衡 。 

3. 分 离 ,zl 选择 上 L ;如 果 发 送 者 选择 分 离 战 略 (L, R), 则 接收 者 的 两 
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个 信息 集 都 处 于 均衡 路 径 之 上 ,于 是 两 个 推断 都 决定 于 贝 叶 斯 法 则 和 发 送 
者 的 战略 :p=1, 4 = 0。 接 收 着 在 此 推断 下 的 最 优 反应 分 别 为 a Md, TÈ 
两 种 类 型 的 发 送 者 获得 的 收益 都 是 1。 另 外 , 还 需 检验 对 给 定 的 接收 者 战 
略 (zsd), 发 送 者 的 战略 是 否 是 最 优 的 。 结 果 是 否定 的 :如 果 类 型 ta 不 先 
择 工 ,而 选择 R, 则 接收 者 反应 为 x 时 ,ta 可 获得 的 收益 为 2, 超过 其 选择 
R 时 的 收益 1。 

4. 分 离 ,z1 选择 R: 如 果 发 送 者 选择 战略 (R, 工 ), 列 接收 者 的 推断 必 
须 为 p=0,g 一 1, 于 是 接收 者 的 最 优 反 应 为 (wu, u), 两 种 类 型 的 发 送 者 都 可 
得 到 2 的 收益 。 如 果 r 想 偏 离 这 一 战略 而 选择 L, 则 接收 者 的 反应 将 会 为 
4, 则 #1 芍 收益 将 威 为 1, 于 是 2, 没有 任何 动机 偏离 R。 类 似 的 , 如 果 e 想 
偏离 这 一 战略 面 选择 R, 则 接收 者 的 反应 将 为 u, ts 的 收益 将 减 为 1, 于 是 
ty 也 没有 任何 动机 偏离 上 。 从 而 E(R, 工 ), Cu, u)p = 0,4= 1] 为 博弈 分 离 
的 精炼 贝 叶 斯 均衡 。 


4. 2.B 就 业 市 场 信 号 


关于 信号 博弈 的 大 规模 深入 研究 始 于 斯 束 斯 (1973) 的 模型 , 该 模型 不 
仅 开创 了 广泛 运用 扩展 式 博弈 描述 经 济 问题 的 先河 ,还 较 旱 给 出 了 如 精炼 
路 时 斯 均衡 等 均衡 概念 的 定义 。 本 节 中 我 们 通过 扩展 式 博弈 介绍 斯 彭 斯 的 
模型 ,并 描述 它 的 一 些 精炼 员 叶 斯 均衡 解 ,在 第 4.4 节 我 们 将 进一步 精炼 后 
的 精炼 贝 叶 斯 均衡 应 用 于 这 一 博弈 。 时 间 顺 序 如 下 : 
1. 自然 决定 一 个 工人 的 生产 能 力 g ERER H) REEL), ?= 
H 的 概率 为 9。 
. 工人 认识 到 自己 的 能 力 ,并 随后 选择 一 个 教育 水 平 兰 0。 
- 两 个 企业 观测 到 工人 的 教育 水 平 (而 不 是 工人 的 能 力 ), 并 同时 向 工 
人 给 出 一 个 工资 水 平 的 出 价 。 了 
4. 工人 接受 两 个 出 价 中 较 高 的 工资 ,在 出 价 相等 时 掷 硬 币 决 定 。 令 w 
表示 工人 接受 的 工资 水 平 。 
工人 的 收益 为 ww- c(7,e), 其 中 cy,e) 是 能 力 为 了 的 工人 得 到 教育 e 
所 花费 的 成 本 ;企业 的 收益 为 yig e)- w, 其 中 y( 5,e) 表 示 能 力 为 9 并 
且 教 育 水 平 为 e 的 工人 的 产 出 ;没有 次 到 工人 的 企业 收益 为 0。 
我 们 (在 本 节 及 第 4.4 节 更 进一步 的 讨论 中 ) 将 集中 王 一 个 特定 的 精炼 


iS) 


w 


O FRKA-FART ATA — A EE R E A ATA, 但 请 
参见 等 式 (4.2.1) 之 前 的 有 关 讨论 - 
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上 贝 叶 斯 均衡 , 其 中 企业 把 教育 水 平 解释 为 关于 能 力 的 一 个 信号 ,从 而 给 受过 
更 高 教育 的 工人 开 出 更 高 的 工资 。 斯 彭 斯 (1973) 论 文 稍 显 不 足 的 一 点 在 
于 ,即使 教育 对 于 生产 率 完全 没有 任何 影响 ( 即 , 即使 能 力 为 3 的 工人 产 出 
等 于 y(7), 和。 完全 无 关 ), 工 资 也 可 以 据 此 随 教育 程度 的 提高 而 提高 。 斯 
彭 斯 (1974) 的 论文 叉 使 其 论证 更 为 一 般 化 , 允许 产 出 不 仅 可 能 随 能 力 而 提 
高 ,还 可 能 随 教育 而 提高 ;类 似 的 结论 从 而 变 为 工资 随 教育 而 提高 的 幅度 ， 
大 于 教育 对 生产 率 的 促进 可 以 解释 的 水 平 。 我 们 语 用 后 面 更 为 一 般 的 方 
HP 

在 学 校 读 书 时 间 更 长 的 工人 , 其 工资 也 更 高 (平均 而 言 ) 已 成 为 广泛 接 
受 的 事实 (作为 一 个 例子 , 2A E ER (Mincer, 1974)。 这 一 事实 也 使 得 用 
在 学 校 读书 的 时 间 来 表示 变量 e 成 为 首选 。 在 分 离 均衡 中 , 我们 可 以 想象 
为 能 力 较 慨 的 工人 只 读 到 高 中 毕业 ,能力 较 高 的 工人 则 完成 了 大 学 教育 。 
但 不 幸 的 是 , 把 e 解释 为 学 校 教育 的 时 间 将 引起 1 4 的 简单 博弈 中 没有 涉 
及 到 的 动态 问题 , 比如 在 工人 大 学 一 年 级 毕业 时 ( 即 在 能 力 较 低 的 工人 根据 
假设 离开 学 校 之 后 ,而 在 能 力 较 高 的 工人 根据 假设 离开 学 校 之 前 ?企业 向 其 
开 出 工资 的 可 能 性 。 在 更 为 丰富 的 模型 中 , 工人 可 以 在 每 一 年 选择 是 接受 
当年 所 给 出 的 最 高 工资 出 去 工作 ,还 是 继续 读书 , 第 二 年 再 进行 选择 。 内 尔 
德 克 (Noldeke) 和 范 ' 达 默 (Van Damme, 1990) 分 析 了 属于 上 面 类 型 的 更 为 
丰富 的 博弈 ,并 证 明 :(i) 存 在 多 个 精炼 贝 叶 斯 均衡 ; (ii) SAD BAT HE B 
4.4 节 运用 的 再 精 烽 方法 非常 相近 的 精炼 之 后 , 只 有 一 个 均衡 存留 下 来 :以 
及 (ii 这 一 存留 的 均衡 与 1 一 4 中 简单 博弈 通过 第 4.4 节 再 精炼 之 后 的 惟 
一 均衡 完全 相同 。 从 而 , 在 1 一 4 的 简单 博弈 中 , 我 们 也 可 以 不 太 严格 地 把 
e 看 成 学 校 教育 的 时 间 , 因为 在 更 为 丰富 的 博弈 中 的 结果 是 一 致 的 。 

不 过 ,在 这 里 我 们 将 把 * 的 差异 解释 为 学 生 在 学 校 里 表现 的 差异 ,而 不 
是 学 生 接受 学 校 教育 时 间 的 差异 , 从 而 绕 过 上 面 的 动态 问题 。 据 此 ,1 一 4 
的 博弈 就 可 以 运用 于 一 组 高 中 毕业 生 { 即 接受 整整 12 年 教育 的 工人 ), 或 一 
组 大 学 毕业 生 或 MBA。 在 这 种 解释 下 , e 衡量 所 学 课程 的 门 数 玉 种 类 、 在 
固定 的 教育 期 内 取得 的 学 分 质量 和 赢得 的 荣誉 等 。 学 费 支 出 (如 果 有 的 话 ) 
从 而 和 e 不 再 相关 ,于 是 成 本 函数 (y, e) 量 度 非 货币 的 (或 精神 的 ) 成 本 : 
在 给 定 的 学 校 中 , 能 力 较 低 的 学 生发 现 要 取得 好 成 绩 更 加 困难 , 同时 在 一 所 


呈正 式 地 ,我 们 假定 商 能 力 的 工人 有 宽 商 的 生产 率 ( 即 对 每 一 e,y(H,e)>y(L,e), 并 生 教 
育 并 不 会 使 生产 率 降低 { 即 对 所 有 的 y 和 所 有 的 。,y.{7,e) 之 0, 其 中 yip, RRENA #9 教育 水 
平 为 e 的 工人 进一步 教育 的 边际 生产 率 )。 
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更 具 竞 争 力 的 学 校 中 要 得 到 相同 的 分 数 也 更 加 困难 。 用 教育 以 此 种 方法 作 
为 一 个 信号 也 可 以 说 明 下 面 的 事实 :企业 雇佣 给 定 学 校 中 最 好 的 毕业 生 和 
最 好 学 校 的 毕业 生 , 并 支付 他 们 更 高 的 工资 。 

斯 朝 斯 的 模型 中 最 关键 的 根 定 是 较 低 能 力 的 工人 发 出 同样 的 信号 要 比 
较 高 能 力 工 人 花费 的 成 本 高 ,更 为 精确 地 , 较 低 能 力 工 人 受 教 育 的 边际 成 本 
要 高 于 较 高 能 力 工人 :对 所 有 e 

e(L,e)>e(H,e), 

其 中 co(7,e) 表 示 能 力 为 了、 教育 水 平 为 e 的 工人 进一步 教育 的 边际 成 本 。 
为 解释 这 一 假定 ,考虑 一 个 教育 水 平 为 e 的 工人 人, 其 工资 水 平 为 w, 如 图 
4.2.3 所 示 , 并 计算 这 一 工人 的 教育 水 平 要 从 e, 提高 到 ez 需要 相应 提高 多 少 
工资 才能 够 得 到 补偿 。 管 案 决定 于 工人 的 能 力 :低能 力 的 工人 发 现 要 取得 更 
高 的 教育 较为 困难 ,于 是 就 需要 工资 增加 得 更 高 些 ( 增 加 到 ww ,而 不 是 只 增 
加 到 wp), 才 足以 补偿 他 的 努力 。 这 一 假定 用 图 形 表示 就 是 低能 力 工 人 的 无 
差异 曲线 较 高 能 力 工人 更 为 陡 靖 一 一 比较 图 中 的 I 和 ro 


ee e 


E 4.2.3 


WE RAAB ECL > AE A TO. ERIR 

型 中 建立 这 一 假定 的 方法 之 一 , RREO BA a A HR — A 
参与 者 代替 , 它 给 出 单一 的 工资 要 约 w, 并 得 到 收益 - [y(?,e)- wl CE 
过 这 种 转换 可 使 模型 属于 前 一 节 定 义 的 单一 接收 者 信号 博弈 )。 为 最 大 化 
其 期 望 收 益 ,根据 信号 要 求 2R 的 要 求 , 对 给 定 的 市 场 在 观测 到 。 之 后 关于 
工人 能 力 的 推断 ,市 场 的 工资 要 约 将 等 于 教育 水 平 为 。 的 工人 的 期 望 产 出 : 
wle)=p(Hle): y(tH,e)+[1- py(Hle)]: y(tL,e), (4.2.1) 

其 中 p( 折 |e) 表 示 市 场 断 定 的 工人 能 力 高 的 概率 。 在 阶段 (3), 直接 分 析 有 
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两 个 企业 相互 竞争 性 地 开 出 工资 要 约 , 也 会 得 到 相同 的 结果 , 而 不 需要 借助 
于 称 之 为 市 场 的 虚拟 参与 者 。 不 过 , 为 保证 企业 将 永远 开 出 等 于 工人 期 望 
产 出 的 工资 ,我 们 还 需要 加 上 另 一 般 定 :观测 到 教育 选择 e 之 后 , 两 企业 持 
有 关于 工人 能 力 的 推断 是 相同 的 , 我 们 仍 用 y( 厅 1e) 表 示 。 由 于 信号 要 求 
3 决定 了 在 观测 到 处 于 均衡 路 径 之 上 的 e 后 ,两 企业 必须 持 有 的 推断 ,我 们 
的 假定 事实 上 就 是 要 求 在 观测 到 不 处 于 均衡 路 径 上 的 e 被 选择 后 , 两 企业 
所 持 有 的 推断 仍然 相同 。 在 这 一 假定 下 , 可 以 进而 得 到 在 任何 精炼 贝 叶 斯 
均衡 中 , 两 企业 给 出 的 工资 要 约 都 为 (4.2.1) 中 的 we), ERB 1.2.8 节 
的 路 特 兰 德 模型 ,两 企业 的 报价 都 等 于 产 出 的 边际 成 本 。 从 而 .在 本 节 的 两 
接收 者 模型 中 (4.2.1) 就 可 以 替代 相互 要 求 2R。 

作为 分 析 这 一 信号 博弈 的 精炼 贝 叶 斯 均衡 的 准备 , 我 们 首先 考虑 和 它 
对 应 的 完全 信息 博弈 。 也 就 是 说 , 我 们 暂时 假定 工人 的 能 力 在 所 有 参与 者 
之 间 是 共同 知识 ,而 不 只 是 工人 的 私人 信息 。 在 这 种 情况 下 , 阶段 (3? 两 企 
业 之 间 的 竞争 意味 着 能 力 为 教育 水 平 为 。 的 工人 可 得 到 工资 z(e)=y 
(9?,e), 从 而 能 力 为 了 的 工人 选择 满足 下 式 的 e: 

maxy(9,e) — cly e) A 

用 < ” (7) 表 示 最 优 解 , 如 图 4.2.4 所 示 , 并 令 we" (aol ye’ (37)]。 


w 能 力 为 ?的 
ARH 


e*n} e 


4.2.4 


现在 ,我 们 (水 远 地 ) 回 到 工人 的 能 力 是 私人 信息 的 假定 。 这 提供 了 一 
种 可 能 性 , 即 低能 力 的 工人 冒充 为 高 能 力 的 工人 , 从 而 可 能 会 发 生 两 种 情 
况 。 图 4.2.5 表示 的 情况 为 ,对 低能 力 工 人 来 讲 要 得 到 教育 水 平 e*( 态 ) 所 
花费 的 成 本 过 高 , 即使 可 骗取 企业 相信 该 工人 是 高 能 力 的 并 可 得 到 工资 
妈 "《( 琅 ), 也 不 足以 补偿 。 也 就 是 说 , 在 图 4.2.5 bw" (1)-cfL,e” 
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(LI>w"(H)- clL,e’ (H)l。 


iL,e) 


eh e* (H) 


4.2.5 


图 4.2.6 则 表示 了 相反 的 情况 , 我 们 可 以 把 这 种 情况 理解 为 低能 力 的 
工人 嫉妒 高 能 力 工人 在 完全 信息 条 件 下 的 工资 和 教育 水 平一 一 也 就 是 说 ， 
w'(L)~c[L,e*(L)]<w"(H)-el[L,e"(H)]o 后 — 种 情况 即 更 却 现 
实 , 而 且 ( 正 如 我 们 将 看 到 的 ) 更 加 有 趣 。 在 工人 的 能 力 不 限 于 两 个 值 的 模型 
中 , 前 一 种 情况 只 有 当 每 一 可 能 的 能 力 值 都 和 其 相 邻 的 可 能 值 有 足够 差异 时 
才 可 能 发 生 。 例 如 , 如 果 能 力 是 一 个 连续 变量 , 则 就 适用 于 后 一 种 情况 。 


yiL, e) 


w* {Ly 


e*(E) e*(H) e 
4.2.6 


和 前 一 节 描 述 的 相同 ,这 一 模型 可 以 存在 3 类 精炼 贝 叶 斯 均衡 :混同 、 
分 离 以 及 杂 合 ,每 一 类 均衡 的 存在 都 十 分 广泛 , 我 们 只 集中 讨论 几 个 例子 。 
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在 两 种 类 型 的 工人 都 选择 单一 的 教育 水 平 es 的 混同 均衡 中 ,根据 信号 要 求 
3, 企业 在 观测 到 er 之 后 的 推断 必须 等 于 其 先 验 推断 , x CH Le, = 9, 这 又 
意味 车 在 观测 到 e 之 后 给 出 的 工资 要 约 必 须 为 
rp 一 gc3y(HHep)+(1-e)y(Lep) - (4.2.2) 

为 完成 对 这 一 混同 精炼 贝 叶 斯 均衡 的 措 述 , 还 必须 (i) 对 不 属于 均衡 教 育 选 
择 的 eA ep 明确 企业 的 推断 w (五 le), 它 又 可 通过 (4.2.1) 决 定 企业 战略 
uw(e) 的 其 余部 分 ,以 及 (ii) 证 明 两 种 类 型 的 工人 对 企业 战略 Ke) 的 最 优 
反应 都 是 选择 e = er, 这 两 步 分 别 代表 了 信号 要 求 1 和 2S ;前 面 还 已 所 到 ， 
(4.2.1) 在 这 一 两 接收 者 模型 中 代表 了 信号 要 求 2R。 

一 种 可 能 情况 是 企业 推断 任何 不 等 于 en 的 教育 水 平 e 都 意味 着 工人 
是 低能 力 的 :对 所 有 天 ep. 都 有 zt(Hle)=9。 尽 管 这 一 推断 看 起 来 可 能 
比较 奇怪 , 可 精炼 贝 叶 斯 均衡 的 定义 中 并 没有 任何 条 件 将 其 排除 在 外 。 
为 要 求 1 到 3 并 没有 对 不 处 于 均衡 路 径 上 的 推断 进行 任何 限制 , 而 要 求 4 
对 信号 博弈 又 没有 意义 。 我 们 将 在 第 4.4 节 应 用 的 再 精炼 方法 的 确 对 信号 
博弈 中 处 于 均衡 路 径 之 外 的 推断 进行 限制 ,事实 上 , 它 排 除了 这 里 所 分 析 的 
推断 。 在 这 里 对 混同 均衡 的 分 析 中 , 我 们 重点 讨论 这 一 推断 是 为 了 氢 述 上 
的 简明 ,但 同时 也 简要 考虑 其 他 推断 。 

如 果 企 业 的 推断 为 


0 See, 
saos Heze, 
则 据 (4.2.1) 企 业 的 战略 为 


a 


(4.2.3) 


yiL, e) H eñe 
i (4.2.4) 


wp 当 e=ep 
能 力 为 了 的 工人 从 而 将 选择 满足 下 式 的 e 
maxw(e)—c(q,e) š (4.2.5) 


{4.2.5) 的 解 十 分 简单 :能 力 为 y AL A ea cp, 或 者 选择 使 y(L,e) 
一 c(y,e) 最 大 化 的 教育 水 平 ( 后 者 恰好 等 于 低能 力 工人 的 。* (LL))。 在 图 
4.2.7 所 示 的 例子 中 ,前 者 对 两 种 类 型 的 工人 都 基 最 优 的 ;低能 力 工人 通过 
Ale” CL), w "(上 L)] 的 无 差异 曲线 处 于 其 通过 点 (ep, wp ) 的 无 差异 曲线 下 
方 ,而 高 能 力 工 人 通过 点 (e,, wy ) 的 无 差 既 曲线 处 于 工资 函数 w = y(L,e) 
的 上 方 。 结 论 就 是 .给 定 图 4.2.7 中 的 无 差异 曲线 .生产 函数 和 图 中 e, 的 
值 , 工 人 的 战略 [e(L)= ep, eC) = ee] 和 (4.2.3) 式 的 推断 oe (He AR 
《4-2.4) 式 企业 的 战略 w(e) 为 博弈 的 混同 精炼 贝 叶 斯 均衡 。 
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y(H,c} 


ay(H,e) 
+0 -DL,e) 


ytL,e) 


4.2.7 


在 图 4.2.7 所 示 的 例子 中 , 同样 的 无 差异 曲线 和 生产 函数 , 还 存在 着 许 
多 其 他 的 混同 精炼 员 叶 斯 均衡 。 在 有 些 均 衡 中 ,工人 可 能 选择 另外 一 个 教 
育 水 平 (而 不 是 图 中 所 示 的 ep); 还 有 的 均衡 中 工人 选择 的 教育 水 平 相同 ， 
但 均衡 路 径 之 外 情况 有 所 差异 。 作 为 前 一 情况 的 一 个 例子 , 令 e 表示 处 于 
ep 和 e" 之 间 的 教育 水 平 ,其 中 图 4.2.7 中 的 。 为 工人 通过 Ce* (L), w 
(二 )) 的 无 差异 曲线 与 工资 函数 w = ge yl He) + (1- 9) yiL, e) ZA 
的 教育 水 平 。 刀 果 我 们 在 (4.2.3) 和 (4.2.4) 式 中 用 é 替换 er, 则 得 到 的 企 
业 的 推 其 和 战略 与 工人 的 战 酷 [e( 工 ) = 2, e(H) = e] 构 成 了 另外 一 个 混同 
精炼 贝 叶 斯 均衡 ; 作为 后 一 种 情况 的 一 个 例子 , 假设 企业 的 推 浙 满 足 
(4.2.3), 只 不 过 教育 水 平 高 于 eFt, 企业 推断 工人 的 类 型 根据 其 先 验 概率 


随机 分 布 : 
o 4 e<e’"Re=e,y 
aeHled=jq esep 


a Bere’, 
其 中 图 4.2.7 的 为 高 能 力 工人 通过 点 (ew, zwp) 的 无 差异 曲线 与 工资 函数 
w=qry(H,e) t+ (L—@) 3( 工 ,e) 的 交点 所 对 应 的 教育 水 平 。 则 企业 的 战 
略为 : 
ylL,e) Hexe, Rese, 
sol wp 当 e= ep 
Wp Mere, . 
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ER ae AY EB A A TA RB Ce (ED = ep, CH) =e, ABST 
YE FPR OL OS o 

现在 , 我们 转向 对 分 离 均衡 的 讨论 。 在 图 4.2.5( 无 妨 嫉 的 情况 } 中 , 最 
自然 的 分 离 精炼 贝 叶 斯 均衡 中 工人 的 战略 为 [e( 上 L)=e*(L),el(H)=e* 
{五 )], 则 信号 要 求 3 决定 了 在 观测 到 两 个 教育 水 平 中 任何 一 个 后 企业 的 推 
断 ( 具 体 地 讲 , eLHle"(L)]=0 H py[Hle"(H)]=1), 于 是 据 (4.2.1) 可 
得 ww[e* (IL)]=w'(L) 且 w[e*(H)] =w*(H)。 与 对 混同 均衡 的 讨论 
栓 似 ,要 完成 对 这 一 分 离 精 疾 册 叶 斯 均衡 的 描述 还 需要 :(i) 明 确 非 均衡 的 
教育 水 平 ( 即 除 e"( 工 ) 和 。”"( 石 ) 之 外 的 e 的 值 ) 被 选中 时 企业 的 推 浙 nL 
le) ,根据 (4.2.1) 它 又 决定 企业 战略 wle) 的 其 余部 分 ;和 (ii) 证 明 能 力 为 
7 的 工人 对 企业 战略 w(e) 的 最 优 反 应 就 是 选择 e =。* (7)。 

满足 这 些 条 件 的 推断 之 一 是 如 果 教 育 水 平 e ARF ee CH), 则 工人 是 
高 能 力 的 , 否则 便 是 低能 力 的 ; 

satos 人 AeL EE) (4.2.6) 


1 4 e2e"(H}). 
于 是 ,企业 的 战略 相应 为 


ad ne) eS UD (4.2.7) 
yCH,e) 4 eze*(H) 
由 于 e* (及 ) 是 高 能 力 工人 对 工资 函数 w= y(H,e) 的 最 优 反应 , 在 这 里 它 
同样 也 是 最 优 反应 。 对 低能 力 工 人 来 讲 , 当 工资 函数 为 w = y(L,e) 时 ,e* 
(〈 工 ) 是 该 工人 的 最 优 反应 ,那么 w* (LL) 一 c[L,e*( 上 L)] 为 工人 在 所 有 e< 
eo” (三 ) 的 选择 中 可 能 达到 的 最 高 收益 。 由 于 低能 力 工 人 的 无 差异 曲线 较 
高 能 力 工人 的 更 为 陡峭 , w CH) — c[ 上 ,e* (于)] 为 低能 力 工人 在 所 有 e> 
eo” (三 ) 的 选择 中 可 能 达到 的 最 高 收益 。 那 么 , 因为 在 没有 妨 嫉 的 情况 下 ， 
w"(L)-c[L,e"(L)]>w"(H)-clL,e" (A) le" (L) EE BAT 
人 的 最 优 反应 。 
此 后 ,我 们 不 再 考 起 没有 妨 嫉 的 情况 。 前 面 已 经 提 到 ,图 4.2.6( 存 在 
妒 妨 的 情况 ) 更 为 有 趣 。 这 时 高 能 力 工人 不 能 简单 地 只 靠 选择 教育 水 平 e。” 
《五 ) 就 可 以 获得 高 工资 w(e) = >(H,e), 而 在 完全 信息 条 件 下 则 可 以 。 为 
了 证 明 其 能 力 , 高 能 力 工人 必须 选择 e, >e* (H), 如 图 4.2.8 所 示 , 因 为 低 
能 力 工人 将 效仿 e" (ADDI e, 之 间 的 任何 教育 水 平 e, 如 果 这 样 做 可 令 企 业 
误 以 为 他 属于 高 能 力 工人 的 话 。 正 式 地 讲 , 现在 一 般 的 分 高 精炼 贝 叶 斯 均 
BP, LARREA eL) =e“*( 工 ), e{ 日 ) =e,], 均 衡 推 断 ux[ Hle* (CL)] 


458 aaa 


=0 H el Hle]=1 WU REWER w’ le'(L)]=w*(L)H wle) 
三 y(H,e,)。 这 也 是 我 们 通过 第 .4.4 节 的 再 精炼 之 后 惟一 留存 的 均衡 结 
果 。 


Ty 


y( He) 


yiL,e) 


e*@) e*(H) es 


Æ 4.2.8 


如 下 企业 对 均衡 以 外 的 教育 水 平 的 推断 可 以 支持 上 面 的 均衡 结果 :如 

R eze, 工人 是 高 能 力 的 ;否则 就 是 低能 力 的 : 
0 当 e<e 
alofi 4 eRe, . 

于 是 , 企业 的 战略 为 
ylL,e) 当 e<e, 
y(H,e) 4ebe,. ， 
给 定 上 面 的 工资 函数 , 低能 力 工 人 有 两 个 最 优 反 应 : 选择 "(LEE 
也 "( 工 ) ;或 者 选择 e 并 赚 得 y( HH, e), 我 们 将 假定 出 现 这 一 无 差异 的 情况 
BY, 工人 更 倾向 于 。" (上 ) ;或 者 我 们 也 可 以 将 e 提高 一 个 非常 小 的 量 ,使 得 
低能 力 工 人 严格 倾向 于 选择 e"( 工 )。 对 高 能 力 工人 来 讲 , 由 于 ce, >e’ 
(H) 选择 e。>e, 要 较 e, 为 劣 。 由 于 低能 力 工人 的 无 差异 曲线 较 高 能 力 工 
人 的 更 为 陡峭 ,后 者 通过 点 (6,, yH, e,)) 的 元 差异 曲线 当 。 < e, 时 处 于 工 
RER w= yL, OREN, 所 以 选择 e<e, 同样 较 e。 WH. MI, 高 能 力 
工人 对 企业 战略 ww(e) 的 最 优 反 应 为 e,o 

和 混同 均衡 的 情况 一 样 , 博弈 也 存在 另外 的 分 离 均 衡 , 在 一 些 均衡 中 ， 
高 能 力 工 人 选择 不 同 的 教育 水 平 (低能 力 工 人 总 是 因 选 择 e"(L ) 而 被 分 


| 
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离 , 参 见 下 文 ), 还 有 些 均 衡 中 教育 水 平 的 选择 eL), e 与 这 里 的 相同 ,但 
处 于 均衡 路 径 之 外 的 推 斯 不 同 。 作 为 前 者 的 一 个 例子 , 令 6 为 高 于 。, 的 教 
育 水 平 ,但 又 不 足以 高 到 使 高 能 力 工 人 不 恩 意 选择 é, 而 宁愿 被 认为 自己 是 
低能 力 的 :对 所 有 ew CH, 6-0 (所 ,2)) 都 要 大 于 y(L,e)-c(H,e)o W 
果 我 们 在 图 4.2.8 的 博弈 中 , 用 z Bt (Ale) WM w(e) 表 达 式 里 的 。, W 
由 此 形成 的 企业 的 推断 和 战略 与 工人 的 战略 [e(1L)=e"(L),e(H)=e] 一 
起 ,构成 一 个 分 离 的 精炼 贝 叶 斯 均衡 。 作 为 后 者 的 一 个 例子 , 令 企业 对 严格 
SbF ce CH) A e, 之 间 的 教育 水 平 的 推断 严格 大 于 0, 为 一 个 足够 小 的 正 
数 , 使 得 据 此 得 出 的 战略 w(e ) 严 格 处 于 低能 力 工人 通过 点 Ce” ( 工 ), w" 
《 工 )) 的 无 差异 曲线 的 下 方 。 

本 节 的 最 后 ,我们 简要 讨论 一 下 杂 合 均衡 。 其 中 一 种 类 型 肯定 选择 某 
一 教育 水 平 ,但 另 一 种 类 型 随机 选择 是 与 第 一 种 类 型 混同 (通过 选择 前 一 类 
型 的 教育 水 平 ), 还 是 与 前 一 类 型 分 离 (通过 选择 不 同 的 教育 水 平 )。 我 们 分 
析 低 能 力 工人 随机 选择 的 情况 ; 习题 4.7 讨论 互补 的 情况 。 假 设 高 能 力 工 
人 选择 教育 水 平 m{ 这 里 脚 标 h 表示 杂 合 (hybrid)), 但 低能 力 工人 随机 选 
FE ws( 以 的 概率 ) 或 er( 以 1-r 的 概率 )。 信 号 要 求 3( 将 其 扩展 到 允许 泥 
合 均衡 存在 的 情况 仍 适 用 ) 决 定 了 企业 在 观测 到 ex 或 er 后 的 推断 : 据 贝 叶 
斯 法 则 可 得 了 


= —_2__ 
KHD E-ga 


并 且 根据 常识 可 得 观测 到 e 后 的 推断 j(Hler)=0。 以 下 三 方面 有 助 于 
理解 (4.2.8): 第 一 ,由 于 高 能 力 工人 总 是 选择 aa, 但 低能 力 工人 只 以 r 的 
概率 选择 i, 观测 到 ej, 就 说 明 工 人 为 高 能 力 的 概率 要 葛 高 一 些 ,于 是 jp 
(Hle >g BL, K n AAF O 时 , 低能 力 工人 几乎 不 会 和 高 能 力 工人 混 
间 , 于 是 pH e ATF 1; 第 三 , 当 w 趋 于 1 时 ,低能 力 工 人 几乎 总 是 和 高 能 
力 工 人 混同 ,于 是 «CH |e, BATEREN g。 

当 低 能 力 工人 选择 ez, 从 而 可 与 高 能 力 工人 相 分 高 时 ,推断 CH | e) 
=0 意 味 着 工资 w(le1)==y(L,eL), 由 此 又 可 推出 er 必须 等 于 e (L): AB 
使 低能 力 工人 乐于 选择 分 高 的 惟一 教育 水 平 (不 论 是 在 这 里 的 随机 情况 中 ，、 
还 是 前 面 讨 论 分 离 均衡 时 的 确定 情况 中 ) 为 工人 在 完全 信息 下 所 选择 的 教 


(4.2.8) 


D MAR 116 页 第 3 MATER: WO EU PC ALB) = pA, B)/ p(B), tH 
(4.2.8), 可 将 贝 叶 斯 法 则 写 为 pC, B) = p( Bl A)-p(A), FM p(AlB)= (BIA): pA) p 
CB). 
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育 水 平 。”( 工 )。 为 理解 这 里 的 原因 , 假设 低能 力 工人 通过 选择 另外 的 e1 关 
eo (上 ) 实 现 了 分 高 ,这 种 分 离 可 带 来 收益 >( 工 ,er) 一 cL,er), 但 选择 。* 
{ 工 ) 可 得 到 的 最 小 收益 为 yiL, e” {LL)] 一 c[L,e "(IL)]( 如 果 企 业 的 推断 
elHle (LIAKFT OM DYER). WAM e" ( 工 ) 的 定义 意味 着 对 所 有 
ÉY ete"(L), BA yl[L,e"(L)]-cl(L,e*(L)] >y( Lie) - (Le) KM 
而 ,不 存在 教育 选择 红头 e ”( 工 ), 且 使 低能 力 工人 有 动机 选择 er ,从 而 实现 
分 离 。 


为 使 低能 力 工人 愿意 随机 选择 分 离 结果 e” (L) 或 混同 结果 es, 工资 水 
F wier) = wr 必须 使 得 工人 在 两 者 间 的 选择 是 无 差异 的 : 


wL) c[L, e" (L)]= wi- (Lie). (4.2.9) 
然而 ,为 使 ws 成 为 企业 支付 的 均衡 工资 , 据 (4.2.1) 和 (4.2.8) 可 得 
es q ` -ow . 
wh a WHT a) ylL,ea) . (4.2.10) 


对 一 个 给 定 的 er 值 , 如 果 (4.2.9) 的 结果 w <y CH, er), WU (4.2.10) TL 
确定 满足 杂 合 均衡 条 件 的 惟一 n 值 , 这 时 低能 力 工人 随机 选择 e"( 工 ) 或 
ens TOR wy >>y(H, es), 则 对 这 样 的 es 值 , 不 存在 杂 合 均衡 。 

图 4.2.9 间接 表示 出 特定 的 e E, 及 与 之 相应 的 x 值 。 给 定 si, 工资 


i ly 


ye) 


r yH, e) 
+0-nyLed 
os 4MH,e) . 
+- pyle) 


WL,e) 
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wh 为 (4.2.9) 的 解 ,于 是 点 (es, ww) 外 于 低能 力 工 人 通过 点 [e”( 工 ) w” 
( 工 )] 的 无 差异 曲线 上 。 给 定 w<ylH, e) WER r Brey (Hee) t (1 
-2(L,e) = zw 这 一 概率 即 为 企业 的 均衡 推断 eH en), TER 
(4.2.8) n= q(t-rV/rl—@q)o WEB, 约 东 条 件 ws < y(H, er) 
等 同 于 w <e,, 其 中 e 为 图 4.2.8 的 分 离 均衡 中 高 能 力 工人 选择 的 教育 水 
平 。 事 实 上 , 随 ea 趋 于 e,, r BF 1, 于 是 x 趋 于 0。 因 而 ,图 4.2.8 描述 的 
分 离 均衡 为 这 里 考虑 的 杂 合 均衡 的 极限 情况 。 

为 完成 对 图 4.2.9 中 杂 合 精炼 贝 叶 斯 均衡 的 描述 , 令 企 业 的 推断 为 :如 
果 e< ea, 工 人 是 低能 力 的 , 否则 是 高 能 力 的 概率 为 r, 低能 力 的 概率 为 1 一: 

0 Heler 
x(Hle)= r Mepe, . 


于 是 , 企业 的 战略 为 
_ fye) Heler 
wl Ly n a Mb eben. 
RE, 只 余下 检验 工人 的 战略 (e( 工 ) 以 的 概率 为 e,, 以 1~x 的 概率 为 e* 
CL) se( A) = ea) 是 企业 战略 的 最 优 反应 。 对 低能 力 工 人 来 讲 , 最 优 的 e< 
er Ae (L), 并且 最 优 的 eSe, 为 %。 对 高 能 力 工 人 来 讲 , es BOF ET 
其 他 选择 。 


4. 2.C 公司 投资 和 资本 结构 


考虑 一 个 企业 家 已 经 注册 了 一 个 公司 ,但 需要 对 外 融资 以 投入 一 个 颇 
显 吸引 力 的 项 目 。 企 业 家 有 关于 已 经 存在 公司 盈利 能 力 的 私人 信息 , 但 是 
新 项 目的 收益 却 无 法 从 原 企业 收益 中 分 出 一 一 所 能 观测 到 的 , 只 有 企业 总 
的 利润 水 平 。( 我 们 也 可 以 允许 企业 家 对 新 项 目的 盈利 能 力 掌握 私人 信息 ， 
但 这 却 会 带 来 不 必要 的 复杂 )。 假 设 企 业 向 洪 在 投资 者 承诺 一 定 的 股权 份 
额 ,以 换取 必要 的 资金 。 WA, 在 什么 条 件 下 应 该 上 马 新 项 目 ,并且 承诺 的 
股权 份额 应 该 为 多 少 ? 

为 把 上 述 问 题 转化 为 一 个 信号 博弈 ,假设 现存 公司 的 利 渔 要 么 高 , 要么 
低 :<= 工 或 五 ,这 里 王 > 工 >0。 为 表现 出 新 项 目 是 具有 吸引 力 的 ,假设 需 
要 的 投资 为 1, 将 得 到 的 收益 为 尺 , 洪 在 投资 者 其 他 方式 投资 的 回报 为 ~， 
且 民 >>I(1+r)。 则 村 弈 的 时 间 硕 序 和 收益 情况 如 下 : 

1. 自然 决定 现存 公司 的 利润 状况 ,x= 工 的 概率 为 p; 

2. 企业 家 了 解 到 n, 其 后 向 潜在 投资 者 承诺 一 定 的 股权 益 份额 ;, 这 里 
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Ss <1; 

3. 投资 者 观测 到 *( 但 不 能 观测 到 n), 然后 决定 是 接受 还 是 拒绝 这 一 
E 

4. 如 果 投 资 者 拒绝 要 约 , 则 投资 者 的 收益 为 FL1+r), 企业 家 的 收益 
为 mr, 如果 投 资 者 接受 , 则 投资 者 的 收益 为 s(n+ R), 企业 家 的 收益 
为 (1 一 s) (r+ R). 

迈 尔 斯 和 迈 卢 夫 (1984) 分 析 的 模型 即 属 此 类 ,尽管 他 们 考虑 的 是 一 大 
公司 (有 股东 和 经 理 ) 而 非 私 人 企业 (惟一 的 所 有 者 充任 公司 经 理 )。 他 们 讨 
论 了 有 关 股 东 利 益 如 何 影响 经 理 效 用 的 不 同 假 定 ; 迪 布 维 格 和 和 森 德 (Zen- 
der)t1991) 推 导出 股东 和 经 理 人 员 间 的 最 优 合约 安排 。 

这 是 一 个 非常 简单 的 信号 博弈 , 从 以 下 两 个 方面 可 以 看 出 :接收 者 行动 
的 可 行 集 非常 有 限 ,发 送 者 的 可 选 信号 稍微 多 一 些 , 但 很 多 是 无 效率 的 ( 随 
后 我 们 将 会 看 到 )。 假 设 在 接收 到 要 约 s 之 后 , 投资 者 推断 <= 了 的 概率 为 
9。 则 投资 者 将 接受 *, 当 且 仅 当 

s[¢+(1-qgQH+R)2I(1tr). (4.2.11) 
对 企业 家 来 讲 , AE BA FES Be] AOA HO n 并 考虑 是 愿意 以 股权 份额 * 为 代 
价 获得 融资 , 还 是 放弃 这 一 项 目 。 当 且 仅 当 王 式 成 立时 , 前 者 更 为 可 取 


<8 z (4.2.12) 


在 混同 精炼 贝 叶 斯 均衡 中 , 投资 者 在 接收 到 均衡 要 约 之 后 的 推断 必须 
为 g=p。 由 于 立项 约束 (4.2.12) 在 m=H 时 比 *= 上 时 更 难以 满足 ,将 
(4.2.11) 和 和 (4.2,12) 联 合 起 来 意 球 着 混同 均衡 只 有 下 式 成 立时 才 存 在 : 


IG+r) R 
PL4(1-p)HtR “A+R . (4.2.13) 


WE p 足够 接近 于 0,(4.2.13) 成 立 , HA R> +r) PWR p È 
RE 1, W(4.2.1 RZ, 只 有 
R- 10+ ra E, : 


从 直观 理解 , 混同 均衡 的 困难 之 处 在 于 , 高 利润 类 型 必须 补贴 低 利润 类 型 : 
在 (4.2.11) 中 令 q= 2,06 sel1at+ryVlpL+A-p)H+R1, WOR 
资 者 确信 n= HP g = 0), 则 他 将 接受 更 小 的 权益 份额 str )/CH + 
R) 。 混 同 均衡 中 所 要 求 的 更 大 的 权益 份额 对 高 利润 企业 来 讲 是 非常 昂贵 
的 一 一 也 许 昂贵 到 使 高 利润 企业 更 愿意 放弃 这 一 新 项 目 。 我 们 的 分 析 证 
明 , 只 有 p 足够 接近 于 0 时 才 存 在 混同 均衡 ,这 时 可 减少 补贴 成 本 ;或 者 如 
果 (4.2.14) 成 立 ,这 时 新 项 目 产 生 的 利润 足以 超出 补贴 成 本 。 


(4.2.14) 
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如 果 (4.2.13) 不 成 立 , 则 不 存在 混同 均衡 , 然而 总 是 存在 分 离 均衡 。 低 
利润 类 型 的 要 约 为 ;= 1(1+r)/(L + RJ), 投资 者 接受 ;高 利润 类 型 的 要 约 
A s<TAtr/(A+ RR), 被 投资 者 拒绝 。 在 这 样 的 均衡 中 ,投资 水 平 无 效 
率 地 降低 了 :新 项 目 肯定 是 可 以 带 来 利润 的 ,但 高 利润 类 型 的 企业 却 放弃 了 
投资 。 这 一 均衡 也 说 明了 发 送 者 的 可 行 信号 集 无 效率 的 情况 :高利 洞 类 型 
的 企业 没有 办 法 把 自己 区 分 出 来 一 对 高 利润 类 型 有 吸引 力 的 融资 条件 对 
低 利 润 类 型 甚至 更 具有 吸引 力 。 正 如 迈 尔 斯 和 迈 卢 夫 所 观察 的 结果 , 模型 
表现 出 的 内 在 视 制 迫使 企业 寻求 债务 融资 或 寻找 内 部 资金 渠道 。 

最 后 ,我 们 简单 考虑 企业 家 在 选择 股权 融资 的 同时 ,还 可 以 选择 全 务 融 
资 的 倩 况 。 假 设 投资 者 接受 了 债务 合同 D, 如 果 企 业 家 没有 宣布 破产 则 投 
资 者 的 收益 为 D, 企业 家 的 收益 为 x+ R 一 了 ;如 果 企 业 家 破产 ,投资 者 的 
收益 为 x+ R, 企业 家 的 收益 为 0。 由 于 工 >0, 则 总 是 存在 混同 均衡 一 一 两 
PACKMAN RS AMM D=1(1+7), FARRAR. Rit. 如果 
LWA RE, HBR +L <I + r), WAER Sp AE TE RE 
务 , 于 是 投资 者 也 不 会 接受 此 项 合同 。 如 果 上 和 五 代表 期 望 利 调 (而 非 确 
定 的 利润 ?时 ,也 可 以 得 到 相似 的 结论 。 假设 类 型 x 的 含义 为 现存 企业 的 利 
WA 1/2 的 概率 为 x+ 收 , 172 的 概率 为 # -天 ,这 时 如 果 工 -天 +R<TI(C1 
+r), 则 低 利润 类 型 将 有 1/2 的 概率 不 能 清偿 债务 D= 11 +r), 于 是 投资 
者 不 会 接受 合约 。 


4. 2.D 货币 政策 


本 节 我 们 继续 讨论 第 2.3.E 节 分 析 的 两 阶段 重复 货币 政策 博弈 ,只 是 
加 入 了 私人 信息 。 和 斯 彭 斯 的 模型 相似 , 博弈 存在 许多 混同 、 杂 合 以 及 分 离 
精炼 贝 叶 斯 均衡 。 由 于 第 4.2.B 节 我 们 已 详细 讨论 过 这 些 均衡 , 这 里 只 简 
要 勾勒 一 个 框架 。 参 见 维 克 斯 (1986) 对 相似 的 两 阶段 分 析 的 详细 讨论 , 以 
及 巴 罗 (1986) 的 多 阶段 声誉 模型 。 

第 2. 3.E 中 讲 到 的 货币 当局 的 单 阶段 收益 为 

Wx, = -cen [bly ta(lx— x )], 

其 中 r 为 真实 的 通货 膨胀 .x* 为 雇主 们 的 期 刻 通 货 膨 胀 , y" 为 有 效率 欧 产 
出 水 平 。 对 雇主 们 来 讲 , 单 阶段 的 收益 为 一 (x, x*)*。 在 我 们 的 两 阶段 模型 
中 ,每 一 参与 者 的 收益 都 是 各 参与 者 单 阶段 收益 的 简单 相 加 , W Cay, i) + 
Winta- mni)? Cra h)’, 其 中 x 为 阶段 * 的 真实 通货 膨胀 ， 
xf AREE t 阶段 开始 时 ) 对 阶段 上 通货 膨胀 的 预期 。 
公益 函数 W(x,x*) 中 的 参数 c 反映 了 货币 当局 在 零 通 胀 和 有 效率 产 


164 FE eae 


出 两 个 目标 之 间 的 替代 ,在 第 2.3.E 节 中 这 一 参数 为 共同 知识 , 现在 我 们 
假定 这 一 参数 只 是 货币 当局 的 私人 信息 c = S= 或 允 ( 分 别 表示 对 治理 通 
货 脱 胀 的 态度 强硬 (strong) 或 软弱 (weak)), 这 里 S>z>0, 从 而 两 阶段 博 
FEAT RT ELUTE : 

1. 自然 赋 对 货币 当局 某 一 类 型 c, e= W 的 概率 为 p。 

2. 雇主 们 形成 他 们 对 第 一 期 通货 膨胀 的 预期 xf。 

3. 货币 当局 观测 到 ni, 其 后 选择 第 一 期 的 真实 通货 膨胀 ri 

4. BEARS x.( 而 不 能 观测 到 c), 然后 形成 他 们 对 第 二 期 通货 膨 

AREY BUA x30 

5. 货币 当局 观测 到 af, 然后 选择 第 二 期 的 真实 通货 膨胀 。 

正如 第 4.2.A 节 已 经 注 明 的 ,从 这 一 两 阶段 货币 政策 搏弈 当中 可 以 抽 
象 出 单 阶段 信号 博弈 。 发 送 者 的 信和 号 为 货币 当局 对 第 一 期 通货 膨胀 水 平 的 
选择 ny, 接收 者 的 行动 为 雇主 们 对 第 二 期 通货 膨胀 的 预期 吃 。 和 雇主 们 第 一 
期 通货 脱 胀 的 预期 以 及 货币 当局 第 二 期 对 真实 通货 膨胀 水 乎 的 选择 分 别 为 
信和 号 博弈 之 前 及 之 后 的 行动 。 

回顾 在 单 阶段 问题 ( 即 第 2.3.E 节 分 析 的 重复 博弈 中 的 阶段 博弈 ) 中 ， 
给 定 雇主 们 的 预期 x*, 货币 当局 对 x 的 最 优选 择 为 


wone ala —b)y* +dx). 


同样 的 论证 结论 意味 着 如 果 货币 当局 的 类 型 为 c, 给 定 预期 eh, 则 其 对 x。 
的 最 优选 择 为 


c fr 

预测 到 这 一 点 ,如 果 雇 主 们 推断 c= W 的 概率 为 g, 并 据 此 开始 第 二 阶段 的 
博弈 , 则 他 们 将 选择 23 (9), 以 使 下 式 最 大 化 

~ ql ag (n5, W)— ah]? — (1- gL ef GS, S)- mf]. (4.2.15) 

在 混同 均衡 中 , 两 种 类 型 所 选择 的 第 一 期 通货 联 胀 相同 , 不 妨 以 x 表 

示 , 于 是 ,雇主 们 第 一 期 的 预期 为 x1 = x* 。 在 均衡 路 径 上 , 雇主 们 推断 “= 

W 的 概率 为 如 ,开始 第 二 阶段 的 博 计 ,并 形成 预期 rp), 则 类 型 为 c 的 货 

币 当局 对 给 定 的 预期 , 选择 最 优 的 第 二 期 通货 脱 胀 水 平 。 具 体 而 言 即 为 码 

[xp),c], 如 此 博弈 结束 。 为 完成 对 这 样 一 个 均衡 的 描述 , 还 必须 ( 同 往 

常 一 样 ) 明 确 接收 者 处 于 均 稀 路 径 之 外 的 推断 ,根据 (4.2.15) 计 算 相 应 的 均 

衡 路 径 之 外 的 行为 ,并 检验 这 些 均衡 路 径 之 外 的 行为 对 任何 类 型 的 发 送 者 ， 

都 不 会 使 他 有 动机 偏离 均衡 。 


[A -b)y* + dx )=xz (ri, c). 
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在 分 离 均衡 中 ,不 同类 型 选择 的 第 一 期 通货 膨胀 水 平 不 同 ,分 别 以 xw 
Als, 表示 ,于 是 雇主 们 第 一 阶段 的 预期 为 直 = prw+ (1 一 g)xs。 观 测 到 
xw 之 后 ,雇主 们 推断 c = W 并 开始 第 二 阶段 ,形成 预期 下 (1); 类 似 地 , 观 
WA rs 形成 的 预期 为 天 (0)。 在 均衡 中 , 软弱 类 型 选择 x (nh), W], 强 
硬 类 型 则 选择 a [ 蕉 (0), S], 博弈 结束 。 为 完成 对 这 一 均 隐 的 描述 , 不 仅 
要 明确 接收 者 均衡 路 径 之 外 的 推 靳 和 行动 , 并 检验 没有 任何 类 型 的 发 送 者 
将 有 动机 偏离 ,这 和 前 面相 同 ;而且 还 要 检验 两 种 类 型 都 没有 动机 去 伪装 另 
外 类 型 的 行为 。 在 这 一 博弈 中 , 软弱 类 型 可 能 会 在 第 一 阶段 被 吸引 选择 
zs 从 而 诱 使 雇主 们 第 二 阶段 的 预期 为 3(0), 并 在 其 后 选择 wt [5(0), 
研 ] 使 博弈 结束 。 这 是 由 于 即使 rs 较 低 ,以 至于 软弱 类 型 有 些 不 情愿 , 但 
都 会 使 焉 (0) 非 常 之 低 ,使 之 可 从 第 二 阶段 的 预料 外 通货 膨胀 wz [nh (0), 
琵 ]- 形 (0) 之 中 获得 巨大 收益 。 在 分 离 均衡 中 , 强硬 类 型 选择 的 第 一 期 通 
货 腾 胀 水 平 必须 足够 低 , 使 得 软弱 类 型 没有 动力 去 伪装 成 强硬 类 型 ,即使 在 
第 二 阶段 可 获得 预料 外 通货 膨胀 的 好 处 。 对 许多 参数 的 什 , 这 一 约束 司 得 
xs 低 于 强硬 类 型 在 完全 信息 下 将 会 选择 的 通货 膨胀 水 平 , 正如 在 斯 彭 斯 模 
型 的 分 高 均衡 中 , 高 能 力 工人 将 过 度 投资 于 教育 一 样 。 


4.3 精炼 贝 叶 斯 均衡 的 其 他 应 用 


4.3.A 空谈 博弈 


空谈 博弈 类 似 于 信号 博弈 , 但 在 空谈 博弈 中 , 发 送 者 的 信 导 只 是 口头 表 
态 一 -- 既 不 需要 成 本 , 亦 没有 约束 作 有 让 , 也 无 法 查证 构成 任何 义务 。 这 种 口 
头 表 态 在 斯 彭 斯 的 信号 博 变 中 是 无 法 得 到 有 用 结果 的 :一 个 工人 简单 定 称 
“我 的 能 力 很 高 ”是 不 可 信和 的 。 不 过 在 其 他 情况 下 , 空谈 也 可 能 会 有 效果 。 
作为 一 个 简单 的 例 于 , 考 虚 很 可 能 发 生 的 一 种 情况 “ 喀 ! 小 心 那 辆 公共 汽 
车 !"。 在 经 济 学 的 应 用 中 ,斯坦 (Stein, 1989) 证 明 联 储 对 政策 的 表态 能 起 
到 一 定 作 用 ,但 又 不 能 太 精 确 计 算 。 马 修 斯 (Matthew, 1989) 研 究 了 总 统 使 
用 否决 权 的 威胁 如 何 影响 到 议会 对 法 案 的 表决 。 肉 分 析 特 定 环境 中 空谈 博 
弈 的 效果 之 外 , 我 们 也 许 更 关心 如 何 设计 一 个 环境 , 可 以 利用 空谈 博弈 的 优 
点 。 为 此 ,奥斯汀 -史密斯 (Austen-Smith, 1990) 证 明 在 某 些 机 制 下 , 自 利 的 
立法 者 之 间 相 互 争论 , 可 以 提高 最 终 法 案 的 社会 价值 , 法 雷 尔 和 吉本 斯 
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(1991) 证 明 在 特定 机 制 下 ,工会 可 以 提高 社会 福利 (尽管 会 带 来 第 2.1.C 
SETAE A RANA dh), 因为 它 可 以 促进 工人 和 管理 层 之 间 的 相互 沟通 。 

空谈 在 斯 彭 斯 的 模型 中 起 不 到 任何 作用 , 是 因为 所 有 类 型 的 发 送 者 对 
接收 者 可 能 的 行为 有 着 相同 的 偏好 :所 有 工人 都 希望 较 高 的 工资 ,而 不 论 其 
实际 能 力 如 何 。 为 了 理解 为 什么 发 送 者 偏好 的 一 致 性 会 影响 空谈 的 作用 
《无 论 是 在 斯 茧 斯 模型 还 是 在 更 为 一 般 的 情况 下 ), 假设 存在 一 个 纯 战 略 均 
衡 ,其 中 部 分 类 型 的 发 送 者 Ti 选择 一 种 信号 m, 而 另外 类 型 的 发 送 者 Ta 
选择 另外 一 种 信号 ml (每 个 T: 可 以 只 包含 一 个 类 型 ,如 在 分 离 均衡 中 的 
情况 :也 可 以 包含 多 种 类 型 ,如 在 部 分 混同 均衡 中 )。 在 均衡 时 ,接收 者 将 认 
om; 是 由 开发 出 的 ,并 在 此 推断 下 选择 最 优 行动 ;我 们 用 a 表示 这 一 行 
动 。 由 于 所 有 类 型 的 发 送 者 对 行动 都 有 相同 的 偏好 , 如 果 某 一 类 型 召 (比方 
说 ) 在 a, M ar ZMERNE a1, 既 然 所 有 类 型 的 偏好 都 一 样 ,那么 都 会 选择 
发 送信 号 m1, 而 不 会 发 送 ma 从 而 破坏 了 前 面 假设 的 均衡 。 例 如 在 斯 彭 
斯 模型 中 , 如 果 一 种 空谈 信号 的 结果 是 高 工资 , 而 另 一 种 空谈 信号 的 结果 是 
低 工 资 , 则 所 有 能 力 水 平 的 工人 都 会 选择 前 一 种 信号 ,于 是 就 不 可 能 存在 一 
个 空谈 可 以 影响 均衡 的 工资 。 

这 样 , 要 使 空谈 起 到 作用 , 一 个 必要 条 件 是 不 同类 型 的 发 送 者 对 接收 者 
行为 的 偏好 不 同 。 第 二 个 必要 条 件 当然 就 是 接收 者 基于 发 送 者 的 不 同类 
型 ,选择 的 最 优 行为 不 同 ( 如 果 接 收 者 的 最 优 行为 与 发 送 者 的 类 型 无 关 , 信 
号 和 空谈 都 豪 无 作用 )。 空 谈 发 挥 作用 的 第 三 个 必要 条 件 是 接收 者 所 偏好 
的 行动 不 会 完全 遭 到 发 送 者 的 反对 。 为 理解 这 一 条 件 , 假设 当 发 送 者 的 类 
型 为 低 时 ,接收 者 偏好 的 行动 为 低 ; 发送 者 类 型 为 高 时 , 接收 者 偏好 的 行动 
为 高 。 如 果 低 类 型 的 发 送 者 偏好 的 行动 是 低 ,高 类 型 发 送 者 偏好 的 行动 是 
高 , 则 交流 得 以 进行 ;但 如 果 发 送 者 的 偏好 反 过 来 , 则 交流 就 不 能 达成 ,因为 
发 送 者 将 会 误导 接收 者 。 交 劳 福 德 和 索 贝 尔 (1982) 分 析 了 一 个 满足 上 述 三 
个 必要 条 件 的 抽象 模型 , 并 建立 了 两 个 直观 结果 :一 般 而 言 , 当 参 与 者 之 间 
的 偏好 排列 更 为 接近 时 , 通过 空谈 可 能 达成 的 交流 就 更 多 , 但 除非 参与 者 偏 
好 的 排列 是 完全 一 致 的 ,无 法 达到 完美 的 交流 。 

前 面 提 到 前 每 一 经 济 学 应 用- 一 ~- 美 联 情 的 空谈 否决 权 的 或 胁 、 辩 论 中 
的 信息 交流 ,以 及 工会 作用 一 一 都 不 只 涉及 到 简单 的 空谈 博弈 , 还 要 用 到 相 
应 经 济 学 领域 更 为 复杂 的 模型 。 要 分 析 这 些 永 用 的 任何 一 种 , 都 不 仅 要 描 
述 单 纯 的 博弈 ,还 需要 用 复杂 的 模型 相配 合 , 而 这 样 又 会 转移 我 们 的 注意 
力 , 忽略 空谈 博弈 本 身 的 机 制 。 所 以 , 本 节 我 们 暂时 采用 与 书 中 其 余部 分 不 
一 致 的 风格 ,只 分 斩 抽 象 的 空谈 博弈 , 而 把 应 用 作为 进一步 阅读 的 内 容 。 
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RA Ps EE Pg By TT fer AE G OAT], 只 是 
收益 情况 不 一 致 。 
1. 自然 从 可 行 的 类 型 集 T= 11,…, tj! 中 根据 概率 分 布 p(zi) 赋 对 发 
送 者 某 一 类 型 u, 其 中 对 所 有 i, p) >0, H ple) +o + pl) = 
1; 
- 发 送 者 观测 到 z, 然后 从 可 行 的 信号 集 M | ms,…, m1 中 选择 一 个 
信号 mj; 
3. 接收 者 观测 到 mj; (而 不 能 观测 到 1;), 然后 从 可 行 的 行动 集 4 = 
tags s as 中 选择 一 个 行动 ak; 
4. 双方 的 收益 分 别 由 Usl aM Url a, BH 
此 类 空谈 博弈 的 关键 特征 是 , 信号 不 论 对 发 送 者 还 是 接收 者 的 收益 函 
数 ,都 没有 直接 影响 。 信 号 能 发 挥 作用 的 惟一 途径 是 通过 它 所 包含 的 信息 : 
借助 于 改变 接收 者 对 发 送 者 所 属 类 型 的 推断 ,信和 号 可 以 改变 接收 者 的 行动 ， 
从 而 对 两 个 参与 者 的 收藏 发 生 间接 影响 。 由 于 可 性 用 不 同 的 诸 言 交流 同样 
的 信息 . 不 同 的 信号 空间 能 够 达到 同 祥 的 结果 。 空 谈 的 原则 是 什么 话 都 可 
以 说 ,但 这 反映 在 模型 中 就 要 求 M 是 一 个 非常 庞大 的 集合 。 因 此 , 我 们 假 
E M 中 的 元 素 ( 刚 好 ) 够 用 来 说 出 需要 表达 的 信息 ;也 就 是 说 , M = T。 对 
本 节 的 内 雁 ,这 一 假定 与 允许 什么 都 可 以 说 是 等 价 的 ;但 到 第 4.4 节 的 内 容 
OSDIR UTRA BG), 就 需要 重新 考虑 这 一 假定 了 。 
因为 最 简单 的 空谈 博弈 和 信和 号 博弈 的 时 间 顺 序 相同 ,对 这 两 类 博弈 中 
精炼 贝 叶 斯 均衡 的 定义 也 是 相同 的 ;空谈 博弈 中 的 纯 战 略 精 代 贝 叶 斯 均衡 
为 满足 信和 号 要 求 (1》 (2R)、(2S) 和 (3) 的 一 组 战略 m” (M a" (mi) 及 
推断 elil xm)。 尽 管 信号 要 求 (2R) 和 (2S) 中 的 收益 函数 Usl ma.) 
和 UR(Ei, mj, ak) 分 别 等 价 于 这 里 的 Usl ti, ar) FI UR(ti;, as), 但 信号 博弈 
和 空谈 博弈 的 一 个 不 同 之 处 在 于 , 后 者 总 存在 一 个 混 局 均衡 。 因 为 信号 对 
发 送 者 的 收益 没有 任何 直接 影响 , 如 果 接 收 者 将 忽视 任何 信 导 , 则 混同 就 是 
发 送 者 的 最 优 反应 ;因为 信号 对 接收 者 的 收益 没有 任何 直接 影响 , 如 果 发 送 
者 选择 混同 ,接收 者 的 最 优选 择 就 是 把 视 任何 六 号。 正式 地 , S a ERE 
收 者 在 混同 均衡 的 最 优 行动 , 也 就 是 说 , a" 满足 


max D PC) URC tr a4) ` 
EA PET, 
发 送 者 选择 任何 混同 战略 , 接收 者 对 所 有 信号 都 维持 先 验 概率 推断 plr). 


(不 论 是 处 于 均衡 路 径 之 上 还 是 之 外 ), 并 对 所 有 信号 都 选择 行动 “是 一 
个 混同 精炼 只 叶 斯 均衡 。 从 而 空谈 博弈 中 一 个 有 意思 的 问题 就 是 是 否 存在 


N 
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非 混 同 均衡 。 下 面 讨论 的 两 个 抽象 空谈 博弈 分 别 说 明了 分 离 均 衡 和 部 分 混 
同 均 衡 存 在 的 情况 。 

我 们 首先 考虑 两 种 类 型 .两 种 行动 的 例子 : Tit, tui problt,) = p, A 
= jar, enl。 我 们 也 可 以 使 用 类 似 于 图 4.2.1 中 两 类 型 .两 信号 、 两 行动 的 
信号 博弈 描述 这 里 空谈 博 蛮 的 收益 ,但 类 型 一 -行动 组 合 (ia,ax) 带 来 的 收 
益 与 选择 什么 信和 号 无 关 , 于 是 我 们 又 可 以 用 图 4.3.1 描述 收益 情况 。 每 一 
单元 内 的 前 一 数值 表示 发 送 者 的 收益 ,后 一 数值 表示 接收 者 的 收益 , 但 此 图 
并 不 是 一 个 标准 式 博弈 ,而 只 是 简单 表示 出 在 每 一 种 类 型 一 -行动 组 合 时 
双方 参与 者 的 收益 。 为 满足 前 面 所 讨论 空谈 发 挥 作 用 的 必要 条 人 忻 , 我 们 对 
接收 者 的 收益 作 了 选择 ,使 得 当 发 送 者 类 型 为 低 (zi ) 时 ,接收 者 偏好 的 行动 
为 低 (aL); 类 型 为 高 时 ,偏好 的 行动 亦 为 高 。 为 体现 第 一 个 必要 条 件 ,假设 
两 种 类 型 的 发 送 者 对 行动 的 偏好 相同 , 例如 xz > ze 且 y>w, 于 是 两 种 类 型 
在 cr May 中 都 偏好 ar。 则 两 种 类 型 都 希望 能 使 接收 者 相信 : = #1 ,于 是 
接收 者 元 法 相信 任何 一 方 的话 。 在 这 一 两 类 型 、 两 行动 博 穿 中 ,满足 第 一 和 
第 三 个 必要 条 件 的 惟一 情况 只 有 zx 之 z 且 y 专 ww 一 一 参与 者 的 利益 完全 一 
致 ,可 以 理解 为 在 给 定 发 送 者 类 型 的 情况 下 , 双方 参与 者 认为 应 该 选择 的 行 
动 是 完全 相同 的 。 正 式 地 , 在 此 空谈 博弈 的 分 离 精炼 贝 叶 斯 均衡 中 .发送 者 
SREB [ m Ctr) = ths m Cty) = tn], 接 收 者 的 推断 为 Gle) =1 A alel 
ty) ==0, 并 且 接 收 者 的 战略 为 [a (tL) = aL,alzp) =an]。 为 使 上 述 战略 和 
推断 成 为 均衡 结果 ,每 一 类 型 的 发 送 者 n 必须 偏好 于 说 出 真实 情况 , 从 而 
使 接收 者 选择 行动 et, 而 不 愿意 说 谎 以 诱 使 接收 者 选择 行动 w。 所 以 , 4 
且 仅 当 «Pz 且 y< 时 , 才 存 在 分 离 均衡 。 
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我 们 的 第 二 个 例子 是 克 劳 福 德 和 索 贝 尔 模型 的 一 种 特殊 情况 。 现 在 类 
型 、 信 号 和 行动 空间 都 是 连续 的 :发送 者 的 类 型 在 0 到 1 的 区 间 内 均匀 分 布 
(正式 地 , 工 = [0,1] 且 对 所 有 的 :ET,ztT)=1); 信 和 号 空间 即 为 类 型 空间 
(M = 工 ); 行 动 空间 为 0 到 1 之 间 的 区 间 (A =[0,1])。 接 收 者 的 收益 函数 
为 Ug(t,a) = 一 (a 一 2z), RRA BBW Us(1,a)= -Fa 一 (e+ 
56)]?, 从 而 发 送 者 的 类 型 为 : 时 ,接收 者 的 最 优 行动 为 a= ,但 对 发 送 者 来 
讲 , 最 优 行为 都 是 a = :+65。 也 就 是 说 ,不 同类 型 的 发 送 者 对 接收 者 行为 的 
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偏好 不 同 (具体 地 讲 , 较 高 的 类 型 偏好 的 行动 也 较 高 ), HAS SRA Ae 
好 并 不 是 完全 对 抗 性 的 (具体 地 讲 , 参数 5&>0 衡量 参与 者 偏好 的 一 致 
性 一 一 当 5 更 接近 于 0 时 ,参与 者 的 利益 更 为 一 致 ) 。 

克 劳 福 德 和 案 贝 尔 证 虹 这 一 模型 (以 及 与 之 相关 的 许多 类 型 的 模型 ) 所 
有 的 精炼 员 叶 斯 均衡 等 价 于 以 下 形式 的 部 分 混同 均衡 :类 型 空间 被 分 割 为 
个子 区 间 ,[ C0, £1), [£n 22). [za-1,1],…i 属 于 某 一 给 定 区 间 的 所 
有 类 型 都 选择 同样 的 信号 ,但 属于 不 同 区 间 的 类 型 所 选择 的 信号 也 不 相同 。 
前 面 已 经 提 到 , 混同 均衡 (nw = 1) 总 是 存在 。 我 们 将 证 明 , 给 定 偏好 程度 参 
数 5, 存 在 一 个 能 够 在 均衡 中 出 现 的 区 间 数 (或 称 “ 段 数 ") 的 最 大 值 ,用 n” 
(ORR, 并且 对 每 一 个 n =1,2,…, n" (5&5) 都 存在 部 分 混同 均衡 。 随 的 
降低 , 可 使 n° (58) 提高 一 一 从 这 一 点 来 说 , 当 参 与 者 的 偏好 分 布 更 为 一 致 
时 , 通过 空谈 就 可 以 达到 更 好 的 沟通 。 同 时 ,对 所 有 5>0, n" (5) 都 是 有 限 
值 ;但 当 & 趋 于 0 时 , nw" (5) 趋 于 无 穷 大 一 一 只 有 当 参 与 者 的 偏好 完全 一 
致 时 , 才 可 能 达到 完全 交流 。 

本 节 的 最 后 , 我 们 分 析 上 述 部 分 混同 均衡 的 特征 , 首先 用 两 段 均衡 (n 
=2) 进 行 说 明 。 假设 在 区 间 [0. zi) 的 所 有 类 型 选择 一 种 信号 , 而 属于 区 间 
[z1,1] 的 选择 另 一 种 信和 号。 接收 到 属于 区 间 [0, zt) 的 类 型 发 送 的 信号 后 ， 
接收 者 将 推断 发 送 者 的 类 型 在 [0, zt) 上 均匀 分 布 , 于 是 接收 考 的 最 优 行动 
将 是 xi172; 类 似 地 ,接收 到 尾 于 区 闻 [zt 1] 的 类 型 发 送 的 信号 后 , 接收 者 的 
最 优 行动 将 为 (zi + 1)/2。 为 使 [0, zi] 中 的 类 型 愿意 选择 他 们 的 信号 , 必 
须 满足 区 间 中 的 所 有 类 型 和 (zi+ 1)72 相 比 ,更 偏好 xz1/2; 类 似 地 ,所 有 x, 
之 上 的 类 型 在 (ri+ 1/2 zt2 中 ,更 偏好 (zi + 1)/2。 

因为 发 送 者 的 偏好 在 对 其 而 言 的 最 优 行动 的 两 侧 是 对 称 的 , 如 果 两 个 
行动 的 中 点 超过 了 对 他 所 属 类 型 而 言 的 最 优 行动 : +65( 如 图 4.3.2 所 示 )， 

中 点 


+h/2 
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和 (zi+ 1)/2 相 比 ,他 会 更 偏好 x1/2; 但 如 果 t+ 6 超过 了 中 点 , 则 更 偏好 
Cait D/2。 那 么 ,要 使 两 步 均 衡 存在 , ri 所 表示 的 类 型 zi, 其 最 优 行 动 必 
须 恰好 等 于 两 个 行动 的 中 点 : 
ziten iti 或 2) -2 
由 于 类 型 空间 为 工 = [0,1], xi LUM HE, PRBS RAH b<1/4 
时 存在 ;因为 5 沁 1/4 时 , 参与 者 的 偏好 过 于 不 一 致 , 以 致 于 这 种 非常 有 限 
的 交流 也 无 法 达成 。 

为 完成 对 这 一 两 步 均衡 的 讨论 ,我 们 再 来 看 处 于 均衡 路 径 之 外 的 情况 。 
克 劳 福 伪 和 察 员 尔 通过 指定 发 送 者 的 (混合) 战略 , 使得 不 存在 均衡 之 外 的 
信号 :所 有 z < zi 的 类 型 根据 [0,x] 上 的 均匀 分 布 随机 选择 一 个 信号 ;所 有 
tSr 的 类 型 根据 [ =, 1] 上 的 均匀 分 布 随机 选择 一 个 信 导 。 册 于 我 们 假定 
AM = 工 ,均衡 中 也 就 不 存在 肯定 不 会 被 选择 的 信号 , 于 是 接收 者 在 所 有 可 能 
信号 之 后 的 推断 由 信号 要 求 3 决定 :观测 到 任意 [0, x1] 间 的 信号 后 , 接收 
者 的 推断 为 : AEM, x1] 均 匀 分 布 ;观测 到 任意 [x1,1] 间 的 信和 号 后 , 接 
收 者 的 推断 为 在 区 间 [ ay 11 均 匀 分 布 (在 发 送 者 混合 战略 中 使 用 均匀 分 
布 完全 不 同 于 对 发 送 者 类 型 均匀 分 布 的 假定 ;发送 者 的 混合 战略 也 可 以 运 
用 相同 区 间 上 其 他 任何 严格 正 的 概率 分 布 )。 作 为 对 克 劳 福 德 和 索 贝 尔 方 
法 的 一 种 变化 ,我 们 可 以 指定 发 送 者 的 一 个 纯 战 略 ,同时 选择 接收 者 对 均衡 
路 径 之 外 信号 的 合适 的 推断 。 例 恕 , 令 发 送 者 的 战略 为 所 有 <r 的 类 型 
选择 信号 0, 且 所 有 :之 zx! 的 类 型 选择 信号 xt; 同时 令 接收 者 观测 到 [0， 
zi] 间 的 信号 时 推断 * 在 [0, zj] 区间 服从 均匀 分 布 ,观测 到 [zu 1] 间 的 信 
号 时 推断 + 在 区 间 服 从 均匀 分 布 。 

为 描述 一 个 n BOI, 我 们 重复 应 用 下 面 从 两 段 均衡 中 观测 到 的 结 
果 : 上 面 的 一 段 [z1,1] 比 下 面 的 一 段 [0, zi] 要 长 46。 这 一 观测 结果 可 根据 
以 下 事实 得 出 :给 定 发 送 者 的 类 型 (+ ) 对 发 送 者 而 言 的 最 优 行动 (4+ 6 ) 比 
接收 者 的 最 优 行动 (+ ) 高 出 5。 那么 , 如 果 相 邻 两 段 的 长 度 相等 ; 两 段 之 间 
的 临界 类 型 (两 段 均衡 中 的 z1) 就 会 严格 偏好 于 选择 与 上 面 一 段 相对 应 的 
信号 ;事实 上 , 稍 低 于 临界 值 的 类 型 也 会 有 相同 的 偏好 。 使 临界 类 型 在 两 段 
之 间 没 有 差别 的 惟一 方法 (并 从 而 使 高 子 和 低 于 临界 值 的 类 型 严格 偏好 各 
自 的 信号 ) 就 是 适当 地 使 上 面 一 段 较 下 面 一 段 稍 长 一 些 ,具体 证 明 如 下 ， 

如 果 [ zn -1,x4] 段 的 长 为 c( 即 x 一 zx-1=c), 则 接收 者 与 此 段 相应 的 
最 优 行动 (具体 地 讲 , 即 (z+ zs-1)/2) 要 比 临 界 类 型 x 的 最 优 行动 (具体 
地 讲 ,为 z+ 6) 低 (c/2) + 56。 为 使 临界 类 型 mw ERPB eis ze] 和 
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(ays cee JAS, 接收 者 与 后 面 一 段 相应 的 最 优 行动 必须 比 zx 的 最 优 
行动 高 出 (c/2) +b: 


+ 
TAA Crta) = $to 或 merase tad. 


从 而 证 明了 每 一 段 都 比 于 一 段 长 出 42。 

在 n 段 均衡 中 ,如 果 第 一 段 的 长 度 为 da, 则 第 二 段 的 长 必须 为 d+ 46， 
第 三 段 的 长 为 4 + 865, 如 此 等 等 。 第 n 段 必须 恰好 于 :=1 处 结束 ,于 是 必 
定 有 : 


d+(ad+46)+--+Ldt(n-1)46)=1. 
运用 等 差 数列 求 和 公式 1+2+… + (n 一 1)= n(x 一 1)/2, 我 们 得 到 
nd+ntn—-1).26=1. (4.3.1) 
给 定 满足 n(n —1)+26<1 的 任意 ,都 存在 一 个 a 的 值 满足 (4.3.1)。 也 
就 是 说 ,对 n(n -1)-28<1 的 任意 "都 存在 一 个 n 段 部 分 混同 均衡 , 并 
县 其 第 一 段 的 长 度 为 满足 (4.3,1) 式 的 相应 的 4 值 。 由 于 第 一 段 的 长 度 必 
须 是 正 的 ,这 一 均衡 中 , 分 段 的 最 大 可 能 数 ,a (6), DIE nin-1)-25<1 
的 最 大 的 n fA. BHI KARRRHAA YB un” (8) 为 小 于 fl + 
VI+(275J]/2 的 最 大 的 整数 。 它 与 在 两 段 均 衡 中 推导 的 结论 是 一 致 的 ， 
即 当世 174 时 ,na (5)=1; 如 果 参 与 者 间 的 偏好 过 于 不 一 致 , 则 不 可 能 发 
生 交 流 。 还 有 就 是 前 面 讲 过 的 , x“ (4) 随 5 的 递减 而 增 大 ,但 只 有 当 5 趋 
于 0 时 才 趋 于 无 穷 : 当 参 与 者 的 偏好 更 为 一 致 时 , 会 发 生 更 高 程度 的 交流 ， 
但 只 有 在 参与 者 的 偏好 完全 一 致 时 , 才 可 能 达成 完全 交流 。 


4.3.B 非 对 称 信 息 下 的 序 黄 谈判 


考虑 企业 与 工会 就 工资 问题 进行 谈判 的 情况 。 为 简化 分 析 , ee eA 
的 工人 数 是 一 定 的 。 工 会 的 保留 工资 (reservation wage )( 即 工会 成 员 不 爱 
雇 于 该 企业 时 仍 可 获得 的 收入 ) 为 wr。 企业 的 香油 用 x 表示 ,服从 区 间 
Cai, rr] 上 的 均匀 分 布 ,但 x 的 真实 值 却 为 企业 的 私人 信息 ,例如 企业 在 新 
产品 计划 阶段 就 掌握 一 些 普 通 工人 不 知道 的 知识 。 我 们 假定 w, = xz =0, 
以 使 表示 更 为 简明 。 

谈判 博弈 最 多 持续 两 个 时 期 。 在 第 一 个 时 期 , 工会 给 出 工资 要 价 w, 
如 果 企 业 接收 该 要 价 , 则 搏弈 结束 :工会 的 收益 为 w 企业 收益 为 ~ wi 
《上 述 收益 为 参与 双方 在 商定 的 整个 合同 期 间 - 一 一般 为 三 年 一 一 工资 与 
《 净 ) 利 渔 的 现 值 )。 如 果 企 业 拒 绝 要 价 ,博弈 进入 第 二 时 期 , 工会 给 出 第 二 
个 工 次 要价 ws。 如 果 企 业 接受 这 一 要 俩 则 参与 双方 的 收益 现 值 分 别 为 
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《 按 第 一 时 期 的 口径 ): 王 会 Swe, 企业 O(n - we), 这 里 的 6 既 反 映 了 折 现 
F, 又 体现 出 因 谈 判 延 长 使 有 效 的 合同 期 较 第 一 期 变 短 而 带 来 的 收益 减 
少 。 如 果 企 业 拒 绝 工 人 的 第 二 个 要 价 , 则 博弈 结束 , 双方 参与 者 的 收益 均 为 
0。 在 更 为 现实 的 模型 中 , 可 能 会 允许 谈判 一 直 进 行 下 去 ,直至 达成 一 致 ,或 
者 在 长 时 间 的 罢工 之 后 , 强制 双方 注 守 有 约束 力 的 仲裁 结果 , 参见 索 贝 尔 和 
高 桥 (1983) 及 习题 4.12 中 对 无 限 情况 的 分 析 。 
在 这 一 模型 中 ,定义 及 推导 精炼 贝 叶 斯 均衡 稍微 有 些 复杂 ,但 最 终结 果 
却 很 简单 , 又 十 分 直观 ,因此 我 们 首先 给 出 此 博弈 惟一 的 精炼 贝 叶 斯 均衡 ， 
并 由 此 开始 进行 分 析 。 
， 工 会 第 一 时 期 的 工资 要 价 为 
( 2 Dh 
ro 
。 如 果 企 业 利润 x 超 出 
+_2m1_ 2-8 
mS 2-8" 4-387" 
则 企业 接受 wi EM, 企业 拒绝 wro 
+ 如 果 第 一 期 的 要 价 被 拒绝 , 工会 修 校 其 对 企业 利润 的 推断 :工会 推 
断 «服从 [0, wr ] 区 间 的 均 色 分布。 
+ 工会 第 二 期 的 工资 要 价 ( 在 wl 被 拒绝 的 条 件 下 ) 为 


wy == 2-8 wr 
2 2 23a 


* 如 果 企 业 利润 x 高 于 w , 则 企业 接受 要 价 , 否则 便 拒绝 。 
也 就 是 说 ,在 每 一 期 ,高 利润 企业 接受 工会 的 要 价 , 而 低 利 润 企业 拒绝 ,并 且 
工会 第 二 期 的 推断 反映 出 高 利润 企业 将 会 接受 第 一 期 要 价 的 事实 。 (请 注 
意 ,这 里 用 词 方面 的 细微 变化 , 我 们 既 可 以 指 一 家 企业 有 许多 可 能 的 利润 类 
型 ,有 可 以 指 多 家 企业 各 有 不 同 的 利润 水 平 - ) 在 均衡 条 件 下 , 低 利润 企业 
她 受 一 个 时 期 的 墨 工 ,以 稀 低 工会 第 二 期 的 工资 要 价 。 不 过 , 利润 非常 
低 的 企业 发 现 ,即使 第 二 期 降低 了 的 工资 要 价 仍然 过 高 , 无 法 接受 , 便 再 
次 拒绝 。 

以 上 我 们 描述 了 参与 者 的 战略 及 推断 , 下 面 我 们 定义 博弈 的 精炼 贝 叶 
斯 均衡 。 图 4.3.3 提供 了 简化 后 博弈 的 扩展 式 表 述 ; 只 有 两 个 * 的 值 (xr 
和 xy), 且 工会 的 工资 要 价 也 只 有 两 种 可 能 (wi 和 rp)。 

在 这 一 简化 后 的 博弈 中 , 工会 有 三 个 轮 到 它 行 动 的 信息 集 , 所 以 工会 的 
战略 也 包含 三 个 工资 要 价 :第 一 期 的 要 价 w, 和 两 个 第 二 期 的 要 价 :在 w 
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= wp 被 拒绝 后 的 wz 及 在 w= wz 被 拒绝 后 的 wze。 这 三 个 行动 在 三 个 非 
单 节 信 息 集 进行 ,工会 在 其 中 的 推断 分 别 表示 为 (p,1 一 户 ),(q,1 一 q), 及 
(Cr,1-r)。 在 完整 的 博弈 (而 非 像 4.3.3 所 示 的 简化 后 博弈 ) 中 , 工会 的 一 
个 战略 是 第 一 期 的 要 价 wi 和 第 二 期 的 要 价 画 数 ww), 该 函数 表示 在 
每 一 种 可 能 的 要 价 wi 被 拒绝 后 的 wz。 这 些 行动 都 发 生 于 非 单 节 的 信息 
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集 ,对 工会 可 能 提出 的 每 一 个 不 同 的 第 一 期 工资 要 价 都 有 一 个 第 二 期 的 信 
息 集 (于 是 , 这样 的 信息 集 是 连续 存在 的 , 而 不 像 图 4.3.3 中 只 有 两 个 )。 在 
第 一 期 惟一 的 信息 集 以 及 第 二 期 连续 信息 集中 ,针对 每 一 可 能 的 x 值 都 有 
一 个 决策 结 ( 于 是 ,这 样 的 决策 结 也 是 连续 的 , 而 非 图 4.3.3 中 只 有 两 个 )。 
在 每 一 信息 集中 , 工会 的 推断 为 这 些 决 策 结 的 概率 分 布 。 在 完整 的 博弈 中 ， 
我 们 用 mi 表示 工会 第 一 期 的 推断 ,用 aal wi) 表 示 ( 第 一 期 要 价 w 
被 拒绝 后 ) 工 会 第 二 期 的 推断 。 

企业 的 一 个 战略 包含 了 两 个 决策 (在 简化 的 和 完整 的 博弈 中 都 是 一 样 
的 )。 如 有 果 企 业 的 利润 水 平 为 x 时 , 愿意 接受 第 一 期 的 要 价 w, © Alwil 
m) 等 于 1; 如果 企业 利润 水 平 为 x 并 将 拒绝 wi 时 , 则 等 于 0。 类 似 地 , 如 果 
企业 利润 为 x, 且 第 一 期 的 要 价 为 ww, 企业 愿意 接受 第 二 期 的 要 价 w > 
Arl wla, wi) SF 1, 相同 条 件 下 企业 拒绝 we, WS A2( wlx, zi) 等 于 
0。 企 业 的 一 个 战略 为 一 对 函数 [A:(mwiln), Ar(wela, wid], FER 
的 全 过 程 中 企业 都 有 完全 信息 , 其 推断 也 就 不 必 讨 论 了 。 

WRR wi, wows) FAL Ay (wile), Az liwa lr, zwt] 以 及 推断 [jp 
Cr), py2(xr/ w MER 4.1 节 给 出 的 要 求 2.3、4, 则 构成 一 个 精炼 贝 叶 斯 
均衡 (只 要 工会 的 推断 存在 ,就 满足 要 求 1), 我 们 将 证 明 情 弈 存在 惟一 的 精 
炼 贝 时 斯 均衡 。 论 证 最 简单 的 步骤 是 将 要 求 2 用 于 企业 第 二 阶段 的 决策 
Al wla, tw1) :由 于 它 是 博弈 的 最 后 一 步行 动 ,企业 的 最 优 决策 为 当 且 仅 
Mew. 时 ,接受 wwz, 而 与 wi 的 大 小 无 关 。 确 定 了 企业 战略 的 这 一 部 
分 ,再 把 要 求 2 用 于 工会 第 二 期 对 工资 的 要 价 就 十 分 简单 了 :对 给 定 的 工会 
的 推断 ya(x1w1) 和 企业 随后 的 战略 A2( wlr, wi), we 应 使 工会 的 期 望 
收益 最 大 化 。 论 证 比较 困难 的 部 分 则 在 于 确定 推断 po (al wi), 方法 步骤 
如 下 : 

开始 时 ,我 们 先 和 暂时 考虑 如 王 的 单 期 谈判 问题 (在 后 面 我 们 将 把 这 一 问 
题 的 结果 作为 两 期 问题 中 第 二 期 的 解 )。 在 单 期 问题 中 , 假设 工会 的 推断 为 
企业 利润 水 平 服从 [0,xi] 区 间 的 均匀 分 布 ,这 里 暂时 令 mi 是 任意 值 。 如 果 
工会 要 价 w 则 企业 的 最 优 反应 是 十 分 明显 的 : 当 且 仅 当 r> w 时 接受 mw。 
那么 ,工会 的 问题 就 可 以 表示 为 : 
maxw Probl EEZ wi +0.Prob| 企 业 拒绝 wi . 

这 里 对 有 意义 的 工资 要 价 ( 具 体 地 说 ,0 所 w 志 wy)Prob| 企 业 接受 wl = Gr 
-wmo BRA LAB w” (x,)=m/26 
现在 我 们 (永远 地 ) 回 到 两 期 间 题 。 普 先 我 们 证 明 , 对 任意 值 的 w 和 
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rw2, 如 果 工会 第 一 期 的 要 价 为 w, 并 且 企 业 希 望 其 在 第 二 期 的 要 价 为 wz, 
则 所 有 利润 足够 高 的 企业 将 会 接受 ww,, 而 其 他 情况 下 拒绝 we. 企业 接受 
w 可 得 的 收益 为 x 一 wi, 拒绝 wy 但 接受 we 的 收益 为 Sl- w), ATE 
价 都 拒绝 的 收益 为 0, 从 而 当 > wy > Cre — roz) 或 


wi- wz “( ) 
iog T Cw we 


时 ,和 w 相 比 , 企业 更 偏好 接受 w, E% "一 wi 之 0 时 ,和 两 个 要 价 都 拒 
绝 相 比 , 企业 更 偏好 接受 wi。 也 就 是 说 , 对 任意 值 的 wi 和 w x> max 
Ime? Cw we), wil 的 企业 将 接受 w H a< maria" (wy, w), will 的 企 
业 将 拒绝 uyo 由 于 要 求 2 限 定 了 对 给 定 的 参与 者 的 后 续 的 战略 ,企业 应 该 
选择 最 优 行动 .我 们 可 以 对 任意 值 的 ww, 导出 A (wy |e) ee > maxi” (wr, 
we), w11 的 企业 将 接受 wi, 且 n< maxia" (zol we), wi! 的 企业 将 拒绝 
wit, 这 里 的 w 为 工会 第 二 期 的 工资 要 价 ws( wi)。 

现在 我 们 可 以 推导 jy2(x/w1), 在 第 一 期 要 价 w, 被 拒绝 工会 进入 第 二 
期 信息 集 时 持 有 的 推断 。 要 求 4 意味 着 正确 的 推断 应 该 为 + 服从 [0, x 
(zo)] 区 间 的 均匀 分 布 ,这 里 的 x( w1) 表 示 企 业 对 接受 w, 和 拒绝 w, 但 接 
受 工会 第 二 期 的 最 优 要 价 一 一 w" (nw) = 二 x(w1)/2 无 差异 时 的 x 值 ， 
第 二 期 的 最 优 要 价 为 前 面 讨论 单 期 间 题 时 的 结果 。 为 理解 这 一 结果 , 回 题 
要 求 4 限定 工会 的 推断 应 该 由 贝 叶 斯 法 则 和 企业 的 战略 所 决定 。 那 么 ,给 
定 网 才 推 出 的 企业 战略 的 开始 部 分 At( wi11), 工 会 的 推断 必须 是 , 如 果 进 
入 到 第 二 期 , 企业 的 类 型 服从 [0, xj] 区 间 上 的 均匀 分 布 .其 中 mi = max | x” 
Cwn w2), wi A w: 为 工会 第 二 期 的 工资 要 价 w2( w1)。 给 定 这 样 的 推 
断 , 工 会 最 优 的 第 二 期 要 价 一 定 是 w * (zw)=m(w1)/2, 据 此 可 以 得 到 书 作 
为 自 变 量 w, HEBER: 

mı =max{r" (w, xi/2), wi} . 

HEER RAR, 假设 w Sa Cw, 1/2), WE q = zl, 但 这 与 w 
a’ (Cwi m1/2) 相 矛盾 。 从 而 wi <a” (w, m2), FÆ m =" (wi, m1/2) 或 


n> 


Zw 


(wD) E ww) = 


2-87 

现在 我 们 已 经 把 博弈 简化 为 工会 的 一 个 单 期 最 优化 问题 :给 定 工会 的 
第 一 期 工资 要 价 w, 我 们 已 明确 了 企业 第 一 期 的 最 优 反应 , 工会 在 进入 第 
二 期 时 的 推断 ,工会 第 二 期 最 优 要 价 以 及 企业 第 二 期 的 最 优 反应 ,那么 , 工 
会 选择 的 第 一 期 工资 要 价 应 该 满足 
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max wi “Prob| 企 业 接 受 wil 


+ Bw2( tl)*Prob| 企 业 拒绝 w,, 但 接受 wel 
+ 人 "0'Probj 企 业 拒 绝 zi, 并 拒绝 wel 
请 注意 Probi 企 业 接受 zi 并 非 简单 地 等 于 x 超 出 wi 的 概率 ,而 应 该 是 = 
超出 Cw, ER, 
Probi tke wi 一代 一时 (wt. 
这 一 最 优化 问题 的 解 为 wr ,已 在 分 析 的 开始 时 给 出 , 且 x? 和 zz 分 别 由 
milwr 和 wwr ) 给 出 。 


4. 3.C ”有限 重复 办 逢 困境 中 的 声誉 


在 第 2.3.A 节 对 有 限 重 复 完全 信息 博弈 的 分 析 中 , 我 们 证 明了 如 果 一 
个 阶段 博弈 有 惟一 的 纳什 均衡 , 则 基于 此 阶段 博弈 的 任何 有 限 重复 博弈 有 
惟一 的 子 博 讲 精炼 纳什 均衡 :不 论 博弈 前 面 的 过 程 如 何 ,之 后 的 每 一 阶段 都 
重复 阶段 博弈 的 纳什 均衡 。 但 与 这 一 理论 结果 相反 ,大 量 的 经 验证 据 表明 ， 
在 有 限 重复 囚徒 困境 中 经 常会 出 现 合 作 结 果 , 特别 是 在 距 博 弈 结束 仍 比 较 
远 的 阶段 ;参见 阿 克 塞 尔 罗 德 (Axelrod, 1981) 提 供 的 资料 。 克 雷 普 斯 .米尔 
烙 龙 和 威尔逊 (1982) 证 明 声誉 模型 (reputation model) 可 为 此 现象 提供 合理 
的 解释 .了 

对 有 限 重 复 囚 徒 盟 境 中 的 这 种 声誉 均衡 最 简单 的 展开 需 运 用 到 表示 非 
对 称 信息 的 一 种 新 的 模型 。 我 们 不 再 假定 某 方 参与 者 享有 关于 他 自己 收益 
的 私人 信息 ,而 假定 有 的 参与 者 享有 关于 他 自己 可 选择 战略 集 的 私人 信息 。 
具体 地 说 , 我 们 将 假定 行 (row) 参 与 者 只 能 选择 “ 投 桃 报 李 "(Tit-for-Tat)" 
战略 ( 它 可 使 重复 博弈 以 相互 合作 开始 并 在 其 后 模仿 对 方 的 行动 ) 的 概率 为 
p 而 行 参与 者 可 以 选择 完全 信息 重复 博弈 中 任意 可 行 的 战略 (包括 “ 投 桃 
报 李 ”) 的 概率 为 1 - p。 按 通常 说 法 , 我 们 称 后 一 种 类 型 的 行 参与 者 为 “ 理 
性 的 "。 这 种 方式 在 表达 上 的 优点 在 于 一 旦 行 参 与 者 偏离 了 "“ 投 桃 报 李 " 的 
战略 , 则 行 参与 者 是 理性 的 就 成 为 共同 知识 。 


四 ”我 们 在 第 2.3.B 节 已 证 明 在 无 很 重复 囚徒 萝 境 博弈 中 可 以 达成 合作 , 一 些 学 者 称 这 种 均 
效 为 " 声 兰 "均衡 ,即使 双方 参与 者 的 收益 和 机 会 者 是 共同 知识 。 为 与 此 相 区 分 , 我 们 称 上 面 的 均衡 
为 基于 * 威 荔 和 承诺 "的 均衡 .而 把 * 声 着 "一 词 留 给 车 节 所 讨论 的 博 奔 , 即 至 少 有 一 方 参与 者 不 了 解 
另 一 方 所 掌权 的 全 部 知识 。 

* “这 里 的 英文 原意 是 "针锋相对 ", 译 作 "“ 投 桃 扳 李 * 是 强调 其 相互 合作 的 意思 。 一 一 译注 
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投 桃 报 李 战 略 既 十 分 简单 , 又 合情合理 。 同 时 , 它 还 是 阿 克 塞 尔 罗 德 关 
于 囚徒 困境 的 竞赛 中 的 优胜 战略 。 然 而 ,也许 有 人 会 认为 ,假定 某 参 与 者 只 
有 一 种 可 行 战略 不 够 合理 , 即使 它 是 非常 共有 吸引 力 的 战 路 。 以 表达 上 不 
再 那么 简单 为 代价 ,也 可 以 假定 双方 参与 者 都 可 以 选择 任意 战略 , 但 行 参与 
者 的 收益 为 私人 信息 , 且 投 桃 报 李 严 格 优 于 另外 任何 战略 的 概率 为 p。( 在 
这 一 假定 下 , 表达 变 得 复杂 了 , 是 因为 偏离 投 桃 报 李 战 略 不 再 能 使 行 参与 者 
是 理性 的 成 为 共同 知识 。) 上 面 的 收益 与 重复 博弈 中 典型 的 假定 不 同 :为 使 
模仿 列 参与 者 的 前 阶段 战略 成 为 最 优选 择 , 行 参与 人 的 在 一 个 阶段 的 收益 
必须 依赖 于 列 参与 人 前 一 阶段 的 行动 。 作 为 第 三 种 可 能 性 (同样 以 表达 上 
的 复杂 为 代价 ), 也 可 以 允许 一 方 参与 者 的 阶段 博弈 中 的 收益 为 私人 信息 ， 
但 同时 强调 一 个 阶段 的 收益 只 依 丈 于 本 阶段 的 行动 ,并且 重 复 博 计 的 总 收 
益 等 于 阶段 博弈 的 收益 之 和 。 具 体 地 说 , 我 们 可 以 假定 参与 人 对 合作 的 最 
优 反应 是 合作 的 概率 为 p。 克 雷 普 斯 \、 米 尔格 龙 和 威 尔 进 (此 后 简称 为 
KMRW ) 证 明 这 种 类 型 的 单方 非 对 称 信息 并 不 能 成 为 导致 合作 均衡 的 充分 
条 件 , 而 且 每 一 阶段 都 会 出 现 坦 白 ,与 在 完全 信息 下 的 情况 相同 。 不 过 , 他 
们 还 证 明 ,如 果 存 在 相同 类 型 的 双方 非 对 称 信息 ( 即 , 如 果 同 样 列 参与 者 对 
合作 的 最 优 反应 是 合作 的 概率 为 p), 则 存在 一 个 合作 均衡 :双方 参与 者 相 
互 合作 ,直至 博弈 的 最 后 很 少 几 个 阶段 为 止 。 

在 以 下 的 分 析 中 , 我 们 将 假定 参与 者 只 能 够 选择 投 桃 报 李 战略 的 概率 
为 p。KMRW 的 分 析 中 心 在 于 :即使 p 非常 小 ( 即 :即使 列 参与 人 只 稍微 
有 一 点 怀疑 行 参与 人 可 能 是 非 理 性 的 ), 这 种 不 确定 性 也 可 以 产生 很 大 的 效 
R, 可 从 下 面 几 方面 来 理解 。KMRW 证 明 存 在 一 个 阶段 数 的 上 限 , 在 这 之 
内 双方 的 均衡 行为 都 是 坦白 , 这 一 上 限 决 定 于 p 的 大 小 和 阶段 博弈 的 收益 
情况 ,而 与 重复 博弈 中 的 阶段 数 无 关 。 那 么 .在 一 个 足够 长 的 重复 博弈 任何 
均衡 中 , 双方 参与 者 相互 合作 的 阶段 所 占 部 分 就 会 很 大 (KMRW 是 在 序 贯 
均衡 的 条 件 干 表述 其 结论 的 ,但 他 们 的 论证 同样 适用 于 精炼 贝 叶 斯 均衡 )。 
KMRW 论证 中 关键 的 两 步 为 (i) 如 果 参 与 者 一 旦 背离 了 “ 投 桃 报 李 ” 战 略 ， 
则 行 参 与 人 为 理 福 的 就 成 了 共同 知识 , 于 是 此 后 就 不 会 有 参与 者 再 选择 合 
作 , 于 是 理性 的 行 参与 人 就 有 动机 去 假扮 “ 投 桃 报 李 " 类 型 ; (ii) 对 下 面 给 定 
的 关于 阶段 博弈 收益 情况 的 假定 , 列 参 与 人 对 “ 投 桃 报 李 "的 最 优 反 应 为 相 
互 合 作 ,直至 博弈 的 最 后 一 个 阶段 。 

为 了 给 KMRW 模型 中 的 内 在 机 制 提供 一 个 简单 说 明 , 我 们 下 面 考虑 
其 分 析 的 互补 情 现 : 不 青 候 定 p 非常 小 并 分 析 长 时 期 重复 的 博弈 , 而 假定 
户 足 够 大 ,使 得 在 一 个 短期 重复 博弈 的 均 突 中 ,双方 参与 者 除了 最 后 两 个 阶 
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1. 自然 为 行 参与 者 赋 闻 一 种 类 型 。 行 参与 者 只 能 选择 “ 投 桃 报 李 " 战 
略 的 概率 为 p, 可 以 选择 任意 战略 的 概率 为 1 - p。 行 参与 者 了 解 
他 的 类 型 ,但 列 参 与 者 不 知道 行 参与 者 的 类 型 。 

2. 行列 参与 者 进行 内 徒 困境 博 旗 ,双方 参与 者 在 这 一 阶段 中 的 选择 
为 共同 知识 。 

3. 行列 参与 者 第 二 次 .也 是 最 后 一 次 进行 办 徒 困境 博弈 。 

4. 双方 得 到 各 自 的 收益 。 理 性 行 、 列 参与 者 的 收益 为 各 自 阶段 博弈 的 
收益 之 和 {不 考虑 贴现 }。 阶 段 博 穿 由 图 4.3.4 给 出 。 


列 参与 者 
合作 坦白 


ate [oui | be 
Tee 
坦白 ab 0.0 
H 4.3.4 


为 使 这 一 阶段 博 蛮 成 为 四 徒 困境 , 我们 假定 > 1 Ab <0. KMRW 同时 还 
假定 a +5<<2, 这 使 得 (如 上 面 ( 计 中 所 要 求 的 ) 直 至 博弈 的 最 后 一 个 阶段 之 
前 ,对 投 桃 报 李 的 最 优 反 应 都 是 进行 合作 , 而 不 在 合作 和 垣 白 之 间 相 互 转 
移 。 

和 在 完全 信息 有 限 重 复 因 徒 困境 中 最 后 一 个 阶段 的 情况 相同 , 在 这 里 
的 两 阶段 非 完全 信息 博弈 的 第 二 阶段 ,坦白 (F) 也 严格 优 于 合作 {(C ), 这 对 
理性 的 行 参与 考 和 列 参 与 者 是 一 样 的 。 由 于 列 参与 者 肯定 在 最 后 一 个 阶段 
选择 垣 白 ,对 理性 的 行 参 与 者 来 说 , 也 没有 任何 理由 在 第 一 阶段 选择 合作 。 
最 后 , 投 桃 报 李 的 战略 使 博弈 始 于 相 豆 合作 , 那么 , 需要 确定 的 惟一 行动 便 
是 列 参 与 人 第 一 阶段 的 行动 (X), 它 将 在 第 二 阶段 因 投 桃 报 李 而 被 模仿 ,如 
图 4.3.5 上 所 示 。 


RE Cc x 

理性 行 参与 人 F F 

列 参 与 人 x F 
Æ 4.3.5 


通过 选择 XX C, 列 参与 者 在 第 一 阶段 得 到 期 望 收 益 p:1+ (1-p)5, 且 
在 第 二 阶段 得 到 .aa。( 由 于 投 桃 报 李 的 和 理性 的 行 参与 人 在 第 一 阶段 选 
择 的 行动 不 同 ., 列 参与 人 在 第 二 阶段 开始 时 就 会 知道 行 参与 人 是 投 桃 报 李 
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类 型 的 还 是 理性 的 。 第 二 和 阶段 的 期 望 收益 poo 则 反映 了 列 参与 人 在 决定 
第 一 阶段 是 合作 还 是 坦白 时 对 行 参与 人 类 型 的 不 确定 性 -) 通 过 选择 X = 
下 ,与 之 根 反 , 列 参 与 人 第 一 阶段 获得 p "a, 并 在 第 二 阶段 得 到 0。 因 此 ,下 
式 成 立时 , 列 参 与 人 将 在 第 一 阶段 选择 合作 

p+- p)b>0. (4.3.2) 
在 后 面 ,我们 假定 (4.3.2) 是 成 立 的 。 

现在 , 考 瞄 三 阶段 的 情况 。 给 定 (4.3.2), 如 果 列 参与 人 和 理性 的 行 参 
与 人 都 在 第 一 阶段 选择 合作 , 则 第 二 和 第 三 阶 侦 的 均衡 路 径 将 由 图 4.3.5 
给 出 ,只 需 令 X=C 并 更 改 一 下 阶段 的 表示 数字 。 我 们 将 推导 列 参 与 人 和 
理性 的 行 参与 人 在 第 一 阶段 相互 合作 的 充分 条 件 , 在 此 条 件 下 三 阶段 的 均 
衡 路 径 如 图 4.3.6 所 示 。 

在 这 样 的 均衡 中 , 理性 行 参与 人 的 收益 为 1 + a, 列 参与 人 的 期 望 收益 
Hit+p+O- pot pa。 如 果 理 性 的 行 参 与 人 在 第 一 阶段 选择 坦白 , 则 行 
参与 人 是 理性 的 就 成 为 共同 知识 , 于 是 在 第 二 和 第 三 阶段 两 参与 者 都 选择 
坦白 。 那 么 ,理性 行 参 与 人 第 一 阶 自 选择 坦白 可 得 到 的 总 收益 为 <, 它 要 低 
于 均衡 收益 1 + 4, 于 是 理性 行 参 与 人 没有 动机 去 背离 图 4.3.6 中 隐 含 的 战 
Mo 
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BARE c c 
理性 行 参与 人 c F 
列 参 与 人 c c 


4.3.6 


下 面 , 我 们 考虑 列 参 与 人 是 否 有 动机 背离 。 如 果 列 参与 人 在 第 一 阶段 
就 选择 坦白 , 则 投 桃 报 李 将 在 第 二 阶段 选择 坦白 , 理性 的 行 参与 人 也 将 在 第 
二 阶段 选择 坦白 ,因为 列 参 与 人 肯定 会 在 最 后 阶段 选择 坦白 。 在 第 一 阶段 
坦白 之 后 , 列 参 与 人 必须 决定 在 第 二 阶段 是 合作 还 是 继续 坦白 。 如 果 列 参 
与 人 在 第 二 阶段 也 坦白 , 则 投 桃 报 李 型 在 第 三 阶段 将 选择 坦白 , 于 是 博弈 的 
进行 将 如 图 4.3.7 所 示 。 列 参与 人 从 这 种 背离 中 得 到 的 收益 为 a, 它 小 于 
列 参 与 人 均衡 的 期 望 收 益 的 条 件 为 

l+ pt (l—p)b+ paza. 
给 定 (4.3.2), 列 参与 人 不 选择 这 一 背离 战略 的 充分 条 件 为 


I+ praea. (4.3.3) 
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RRR € 
理性 行 参与 人 c 
列 参与 人 F 
4.3.7 

另 一 种 情况 是 , 列 参 与 人 的 背离 战略 可 以 是 在 第 一 阶段 坦白 ,但 在 第 二 
阶段 合作 , 这 时 投 桃 报 李 将 在 第 三 阶段 选择 合作 , 于 是 博弈 的 进行 如 图 
4.3.8, 列 参 与 人 这 种 背离 战略 的 收益 为 a+b + p'a, EATA ASN 
期 望 收 益 的 条 件 为 

1+pt+(1—- pb+pa>>at+b+ pa. 

给 定 (4.3.2), 列 参 与 人 不 选择 这 一 背 高 战略 的 充分 条 件 为 


a+bel., (4.3.4) 
| := 1=2 1=3 
RARE c F c 
理性 行 参与 人 c F F 
列 参 与 人 F C F 
4.3.8 


现在 , 我 们 已 经 证 明 如 果 (4.3.2)、(4.3.3) 和 (4-3.4) 成 立 , 则 图 4.3.6 
描述 的 博弈 进行 为 三 阶段 四 徒 困境 博弈 一 个 精炼 贝 叶 斯 均衡 下 的 均衡 路 
径 。 对 一 个 给 定 的 p 值 , 如 果 收 益 a Mo 的 值 处 于 图 4.3.9 中 的 阴影 部 
分 , 则 满足 这 三 个 不 等 式 。 随 p ATF 0, 这 一 阴影 部 分 将 会 消失 , 这 与 前 面 
的 结论 是 一 致 的 , 即 本 节 中 我 们 分 析 短 期 博弈 中 的 合作 均衡 , CEREK 


=-p/Q-p) 


a+b=1 


4.3.9 
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É p 值 ,而 KMRW 则 重点 分 析 长 期 博弈 且 p 值 很 小 的 情况 。 另 一 方面 ， 
如 果 p 值 大 到 足以 支持 短期 博弈 中 的 合作 , 它 的 值 当 然 可 以 支持 长 期 博弈 
中 的 合作 。 正 式 地 ,如 果 ab 和 pp 满足 (4.3.2)、(4.3.3) 及 (4.3.4), 则 
WHER AR AY 工 >3, 在 了 阶段 重复 博 蛮 中 存在 一 个 精炼 贝 叶 斯 均衡， 
其 中 理性 的 行 参与 人 和 列 参 与 人 直到 T-2 阶段 之 前 都 选择 合作 , 在 其 
后 的 本 -1 阶段 和 工 阶 段 则 如 图 4.3.5 所 示 。 人 参见 附录 4.3.C 对 这 一 
结论 的 证 明 。 


附录 4.3.C 


为 使 叙述 简洁 ,我 们 以 合作 均衡 (cooperative equilibrium) AR T WE 
复 办 徒 困 境 中 如 下 的 精炼 贝 叶 斯 均衡 , 即 理性 的 行 参与 人 和 列 参与 人 从 博 
弈 开始 直至 工 - 2 期 全 部 选择 合作 , 并 在 其 后 的 工 -1 期 和 T 期 遵循 图 
4.3-5 所 示 的 路 径 。 我 们 将 证 明 ,如 果 ab Mp 满足 (4.3.2)、(4.3.3) 和 
(4.3.4), 则 对 所 有 的 工 >3 都 存在 一 个 合作 均衡 。 证 明 使 用 数学 归纳 法 : 
如 果 对 每 一 个 rc 二 2,3,…, TT 一 1, 在 期 博弈 中 都 存在 合作 均衡 , 则 在 了 
期 博弈 中 存在 合作 均衡 。 

首先 ,我 们 证 明 在 T 期 博弈 中 理性 的 行 参 与 人 没有 动机 背离 合作 均 
衡 。 如 果 行 参与 人 在 上 < 个 -1 中 的 任 一 防 段 选择 坦白 , 他 是 理性 的 就 成 为 
HR, 于 是 行 参与 人 在 上 期 得 到 的 收益 为 a, 其 后 每 一 期 的 收益 都 为 0。 但 
行 参与 人 的 均衡 收益 为 从 * BIT -2 期 每 一 期 都 等 于 1, T -1 期 的 收益 为 
a, 共 为 (T- 上 -1)+a, 于 是 对 任意 的 上 < 工 -1, 坦 白 都 无 利 可 图 。 
4.3.5 中 的 论证 同时 表明 理性 的 行 参与 人 在 工 -1 期 及 工期 也 没有 动机 背 
离 。 

其 次 ,我 们 证 明 列 参与 人 没有 动机 背离 。 关 于 图 4.3,5 的 论证 表明 , A 
参与 人 没有 动机 背离 合作 均衡 战略 ,而 在 工 - 2 期 之 前 选择 合作 , 并 在 T- 
1 期 选择 坦白 ;关于 图 4.3.6 的 论证 表明 , 列 参与 人 没有 动机 选择 如 下 的 背 
离 战略 :从 开始 直到 工 一 3 期 一 直 合 作 ,并 在 工 -2 期 坦白 。 从 而 , 我 们 尚 
需 证 明 列 参与 人 没有 动机 选择 下 面 的 背离 战略 :从 开始 直到 -1 期 一 直 合 
作 , 而 在 : AEA, REKIST -3o 

如 果 列 参与 人 在 + 期 坦白 , 投 桃 报 李 就 将 在 :+ 1 期 坦白 ,而 理性 的 行 
参与 人 也 将 在 :+1 期 选择 坦白 (因为 在 ;+1 期 的 阶段 博弈 中 ,坦白 严格 优 
于 合作 ,在 其 后 从 +: +2 到 了 期 至 少 可 以 得 到 0 的 收益 ,而 在 2 +1 期 合作 
将 使 得 行 参与 人 是 理性 的 成 为 共同 知识 ,使 :+2 BIT 期 的 收益 只 能 等 于 
0), HFRORESMETS SA r 期 之 前 全 都 选择 合作 , 并 都 在 上 +1 
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期 坦白 , 列 参与 人 在 + 2 RAF RAREN WITS A E E E E 
率 为 p。 尖 此 ,如 果 列 参与 人 在 ++1 期 合作 , 则 从 4+2 期 开始 的 后 一 部 分 
的 博弈 等 同 于 c= T— (z+2)+1 时 的 RR, 根据 归纳 法 的 假定 ,在 这 
后 一 部 分 的 * 期 博弈 中 存在 一 个 人 台 作 均衡 , 假定 博弈 按 此 均衡 进行 。 则 列 
参与 人 通过 在 上 期 坦白 ,而 在 :+ 1 期 合作 ,从 + 到 个 共 可 得 到 收益 
atb+[(T-Ce+2)-1] + p+ti-p)otpa. 
它 小 于 列 参 与 人 从 上 到 了 期 的 均衡 收益 
2+(T-(e+2)-1]+p4+(1- p)b+ pa. (4.3.5) 

至 此 ,我 们 已 证 明 列 参与 人 没有 动机 背离 均衡 ,而 从 开始 到 -1 期 合 
作 , 在 上 期 坦白 , 并 在 “+1 期 继续 合作 , 其 前 提 是 在 从 :+2 期 开始 的 以 后 
部 分 的 博弈 接合 作 均 衡 进行 。 更 为 一 般 的 , 列 参 与 人 也 可 以 从 开始 直至 * 
-工期 合作 ,从 : 到 :+ s 期 坦白 ,并 在 :+ s+1 期 合作 。 先 需 考虑 三 种 特殊 
的 情况 :(1) 如 果 t+s= 工 ( 即 列 参与 人 自从 : 期 坦白 后 再 不 合作 ), WAS 
与 人 在 上 期 收益 为 a, 并 在 以 后 收益 为 0。 等 同 于 (4.3.5);(2) 如 果 t+s+ 
1= 工 , 则 列 参 与 人 从 : 期 到 了 期 的 收益 为 a。 + 5b, 甚至 更 低 于 情况 (1); G) 
WÈ t4+54+1=7T-1, WAN BSAM ¢ 到 工期 的 收益 为 a+5+ pa, NF 
《4.3-5)。 余 下 的 就 是 要 分 析 *+s+1<T-1 的 情况 。 和 上 面 ;=0 的 情 
况 相 同 , 在 从 t+ s+2 期 开始 的 以 后 部 分 博 穿 中 存在 一 个 合作 均衡 , 假定 博 
弈 按 此 合作 均衡 进行 。 则 列 参与 人 选择 这 一 理 离 战略 从 : 到 工 期 得 到 的 
收益 为 


até4+[T—-(44+54+2)-1)+p+tl-p)bt pa 
同样 小 于 (4.3.5)。 


4.4 ”精炼 贝 时 斯 均衡 的 再 精炼 


在 第 4.1 节 我 们 定义 了 精炼 贝 叶 斯 询 衡 为 满足 要 求 1 到 4 的 战略 和 推 
断 ,并 已 知 在 这 样 的 均衡 中 , 没有 参与 者 的 战略 包含 始 于 任何 信息 集 的 严格 
ER, RE, 我 们 考虑 两 个 更 进一步 的 要 求 (关于 处 于 均衡 路 径 之 外 的 推 
断 }。 第 一 条 的 形成 出 自 以 下 想法 :由 于 精炼 贝 叶 斯 均衡 排除 了 参与 者 i 选 
择 的 战略 包含 始 于 任何 信息 集 的 严格 劣 战略 的 可 能 性 , 要 令 参与 者 j 相信 
参与 者 i 将 选择 这 样 的 战略 就 是 不 合理 的 。 f 

为 对 这 一 思想 的 理解 更 为 精确 , 考虑 图 4.4.1 中 的 博弈 , 其 中 有 两 个 纯 


Baer FRSA RBEOH 183 


UES A LOPE (L, L, p = 1) ACR, R’, pp 所 1/2)。? 这 一 例 于 关键 
的 特征 在 于 M 为 参与 者 1 GI — TP RS EP R 可 得 的 收益 2 超出 
了 参与 者 1 选择 M 可 能 得 到 的 所 有 收益 一 一 0 和 1。 那么 ,要 令 参 与 者 2 
相信 1 可 能 选择 了 M 是 不 合理 的 ;正式 地 , 1 - p 不 可 能 为 正 , 于 是 p 
一 定 等 于 1. MRE 1- p> RG, WOR, R, pp 所 1/2) 也 不 再 是 
精炼 贝 叶 斯 均衡 ,只 有 (CL, L’, p= 1) 成 为 满足 这 一 要 求 的 惟一 的 精炼 
贝 叶 斯 均衡 。 


图 4.4.1 


这 一 例子 的 另外 两 个 特征 也 值得 简要 提 及 。 第 一 , 尽管 M 是 严格 劣 
战略 , 工 却 不 是 。 如 果 上 也 是 严格 从 战 略 ( 比 如 说 1 的 收益 3 换 成 3/2 时 
的 情况 ), 则 同样 的 论证 意味 着 p 不 可 能 为 正 ,但 这 又 与 前 面 的 结果 p 一 定 
等 于 1 相 牙 盾 。 在 这 样 的 情况 下 , 这 一 要 求 不 限制 参与 者 2 均衡 路 径 之 外 
的 推断 ; 见 下 文 的 正式 定义 。 

第 二 ,这 一 例子 并 不 是 对 开始 时 描述 的 要 求 的 精确 说 明 , 因为 M 并 非 
只 从 一 个 信息 集 开始 成 为 严格 劣 战略 , 而 是 其 本 身 就 是 一 个 严格 劣 战略 。 
为 理解 其 中 的 区 别 , 回顾 第 1.1.B 节 对 严格 劣 战 略 的 定义 ;如果 存在 另外 

-个 战略 si, 使 对 其 他 参与 者 每 一 可 能 的 战略 组 合 , i 选择 s; 的 收益 都 严格 
大 于 选择 : 的 收益 , 则 s 为 i 的 一 个 严格 涯 战略 。 现 在 ,考虑 图 4.4.1 中 
博弈 的 一 种 扩展 情况 , 其 中 参与 者 2 在 图 中 1 的 行动 之 前 有 一 次 行动 , 并 在 


全 ”从 标准 式 表述 中 可 推导 出 博 放 存在 两 个 纯 战 略 纳什 均衡 ;( 工 , 工 ) 和 ( 尺 . R')。 由 于 在 这 
里 的 扩展 式 中 并 不 存在 子 博弈 ,两 个 纳 计 均衡 都 是 子 博 弃 糖 炼 的 。 在 (上 ,LL) 中 ,参与 者 2 的 信息 
集 处 于 均 征 路径, 干 是 ,要 求 3 限定 了 p =1。 在 ( 尺 , ROF, 这 一 信息 集 处 于 均 奖 路 径 之 外 ,但 要 求 
4 并 没有 对 p 进行 任何 限制 ,因此 我 们 只 需要 2 的 推断 p 使 行动 R' 成 为 最 优 一 一 也 就 是 p<<1/2。 
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这 最 初 行动 中 有 两 个 选择 ,一 个 使 博弈 结束 , 另 一 个 轮 到 1 在 图 中 1 的 信息 
集 选 择 行动 。 在 这 一 扩展 的 博弈 中 . M 仍 从 1 的 信息 集 开始 成 为 一 个 严格 
劣 战略 ,但 M 不 再 是 整个 博弈 的 严格 劣 战 略 ,因为 如 果 2 在 初始 节选 择 的 
行动 使 博弈 结束 , 则 L, M 和 RR 全 都 只 能 得 到 相同 的 收益 。 

由 于 在 图 4.4.1 中 M 为 严格 劣 战 略 , 令 参与 者 2 推断 1 可 能 已 经 选择 
了 M 当然 是 不 合理 的 。 但 严格 劣 战略 这 一 条 件 过 强 , 并 由 此 得 到 的 要 求 
又 太 且 。( 因 为 从 一 个 信息 集 开 始 成 为 严格 劣 战 略 的 战略 要 多 于 整个 博 变 
的 严格 劣 战 略 ,要 求 ; 不 相信 i 会 选择 前 一 种 战略 对 7 推断 的 限制 , 要 强 于 
BOR j 不 相信 ii 会 选择 后 一 种 战略 对 其 推断 的 限制 。) 在 直面, 我 们 仍 使 用 
开始 时 给 出 的 要 求 :参与 者 ; 不 相信 和 参与 者 ; 会 选择 从 任何 信息 集成 为 严 
格 劣 战略 的 战略 。 下 面 我 们 给 出 这 一 要 求 的 正式 表述 。 


定义 ”考虑 轮 到 参与 者 i 行动 的 一 个 信息 集 。 战 略 s 为 始 干 这 一 信 
息 集 的 严格 劣 战略 (strictly dominated beginning at this information set), 如 
果 存 在 另 一 个 战略 5, 使 得 对 i 在 给 定 信 息 集 可 能 持 有 的 每 一 推断 , 并 且 对 
每 一 其 他 参与 者 后 续 战 略 可 能 的 组 合 ( 这 里 的 “后续 战略 "(subsequent strat- 
egy), 是 一 个 包含 在 达到 给 定 信 息 集 之 后 可 能 会 发 生 的 所 有 情况 的 完整 
的 行动 计划 ), i 在 给 定 信息 集 根据 # 选择 行动 并 在 其 后 根据 选择 后 续 战 略 
得 到 的 收益 严格 大 于 根据 ;1 选择 行动 和 后 续 战 略 得 到 的 收益 。 


ERs: 在 可 能 的 情况 下 , 在 每 一 参与 者 均衡 路 径 之 外 的 推断 中 , 如 
果 一 个 节点 只 有 在 另 一 参与 者 选择 始 于 某 些 信息 集 的 严格 劣 战略 时 , 才能 
够 到 达 , 则 应 认定 到 达 这 一 节点 的 概率 为 0。 

要 求 5 中 的 限定 语 “ 在 可 能 的 情况 下 ”, 是 考虑 到 类 似 图 4.4.1 中 参与 
者 1 的 收益 3 RAR 3/2 AAA MAL 都 劣 于 尺 。 在 这 种 情况 下 ,要 
求 1 要 求 参 与 者 2 持 有 一 个 推断 ,但 又 不 可 能 在 推断 中 令 到 达 M AL 之 下 
的 节点 的 概率 都 为 0, 于 是 要 求 5 不 再 适用 。 

作为 对 要 求 5 的 第 二 个 说 明 , 考虑 图 4.4.2 MS. HB 4.2.AA 
PHR REEERE, mw) 表示 类 型 选择 信号 m, 且 类 型 e 选择 信 
号 m“; 接 收 者 战略 (a , a") 表示 接收 者 在 L 之 后 选择 行动 a', 在 R 之 后 选 
择 行动 a*。 我 们 可 以 很 容易 地 检验 对 q>1/2 ,战略 和 推断 [( 工 , L), (x， 
d), 户 =0.5,g] 构 成 博弈 的 一 个 混同 精炼 贝 叶 斯 均衡 。 不 过 , 这 一 信号 博 
EA REL, AS 选择 R 没有 任何 意义 。 正 式 地 , 发 送 者 战略 (R, 工 ) 
和 和 (R, 民 ) 一 一 亦 即 t 选择 R 的 所 有 战略 一 一 为 始 于 发 送 者 对 应 于 类 型 ti 
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4.4.2 


HY SBSH sD 那么 ,只 有 在 发 送 者 选择 了 始 于 一 个 信息 集 的 
严格 劣 战略 时 , 才 可 能 到 达 R 之 后 接收 者 的 信息 集中 节点 n. MEA, 存在 
另外 一 个 始 于 任何 信息 集 的 非 劣 战略 一 一 即 ( 工 , R), 可 以 在 尺 之 后 接收 者 
的 信息 集中 到 达 节 点 :2。 从 而 要 求 5 限定 g =0。 因 为 只 有 在 9 之 1/2 时 ， 
f(GL,L),(asae), 户 =0.5,g] 为 博弈 的 精炼 中 时 斯 均衡 ,此 均衡 不 能 满足 要 
求 5。 

可 以 针对 第 4.2.A 节 定 义 的 信号 博弈 精炼 贝 叶 斯 均衡 ,将 要 求 5 重新 
表述 如 下 。 


定义 ”在 信号 博弈 中 , M 中 的 信号 m 称 为 下 中 类 型 ty HH tes 
(dominated for type ¢;), 如 果 存 在 另外 一 个 信号 mj, 使 得 # 选择 mj 的 最 低 
可 能 收益 大 于 5 选择 xm; 的 最 高 可 能 收益 : 


min U,C £i, mj, ar) > max U,(¢;, mjra) - 
min sC tis mjs ae) mag Us (ers my a) 


信号 要 求 5 如 果 m 之 后 的 情 息 集 处 于 均衡 路 径 之 外 , 且 m 为 类 型 
# 的 劣 信号 , 则 (在 可 能 的 情况 下 ) 接 收 者 的 推断 p(t;1 zi) 中 , 认为 发 送 者 
的 类 型 为 1; 的 概率 应 该 等 于 0( 只 要 m, PAT 中 所 有 的 类 型 都 是 劣 稼 号 ， 


中” 由 于 发 送 者 对 应 于 类 型 1 的 入 息 集 为 一 个 单 节 信息 集 , 在 定义 始 于 这 一 信息 乐 的 严格 劣 
战略 时 , 发 送 者 的 推 斯 不 起 任何 作用 。 则 证 明 CR, 工 ) 和 (RR, RFK i RE R, 
只 需 证 明 对 边 收 者 的 每 战略 ,类 型 5 的 发 送 者 选择 另 一 战略 都 可 以 获得 更 高 的 收益 。( 上 , R) 
是 这 么 一 个 虐 略 : 它 使 得 4 的 最 低 收益 为 2, 而 (下, 上 ) 和 (RR, 民 ) 给 rt 的 最 高 收益 为 1。 
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即 为 适用 这 一 要 求 的 可 能 情况 )。 

在 图 4.4.2 的 博弈 中 ,分 离 精 炼 众 叶 斯 均衡 [( 上 , R),(w,u),p=1,9g 
=01 则 自然 满足 信号 要 求 5( 因 为 不 存在 这 一 均衡 路 径 之 外 的 信息 集 )。 作 
为 一 个 需 经 检验 才 可 确定 满足 信号 要 求 5 的 例子 , 假设 当 类 型 ,选择 R 
时 ,接收 者 的 收益 为 :选择 4 的 收益 为 1, 选择 u 的 收益 为 0, 而 不 再 是 图 中 
的 0 和 1。 这 夺 ,[( 工 ,上 L), (uw,4),p=0.5,g] 对 任意 的 g 值 都 是 一 个 混同 
精炼 贝 吐 斯 均衡 ,于 是 [( 工 , 工 ), (ww, 4),p 一 9.5,g =0] 就 是 一 个 满足 信号 
要 求 5 的 混同 精炼 贝 叶 斯 均衡 。 

EAREN, 存在 看 起 来 不 合 博 理 然而 却 满足 要 求 5 ER OL OE 
均衡 。 博 弈 论 的 最 新 研究 中 , 最 为 活 胰 的 领域 之 一 便 涉及 到 如 下 两 个 相关 
问题 :人 ) 在 什么 情况 下 ,一 个 精炼 中 叶 斯 均衡 是 不 合理 的 ; (让) 在 对 均衡 的 
定义 中 还 能 够 再 加 上 哪些 要 求 , 以 日 除 这 些 不 合理 的 精炼 抽 叶 斯 均衡 。 赵 
和 克 雷 普 斯 (1987) 在 这 一 领域 的 研究 中 作出 了 早期 开创 性 的 并 有 广泛 影响 
的 贡献 。 在 本 节 的 最 后 ,我 们 讨论 他 们 论文 中 三 个 方面 的 问题 ;:(1)“ 啤 酒 
或 热狗 "(Beer & Quiche) fÈ SWF, 它 说 明了 明显 不 合理 的 精炼 员 叶 斯 均 
衡 也 可 以 满足 信号 要 求 5;{2z) 对 信号 要 求 5 的 一 个 强化 要 求 {但 绝 非 可 能 
的 最 强 条 件 的 要 求 ), 称 为 直观 标准 (3) 直 观 标准 在 斯 彭 斯 的 就 业 市 场 信号 
博弈 中 的 应 用 。 

在 “啤酒 或 热狗 "信号 博弈 中 , 发 送 着 有 两 种 可 能 的 类 型 :tk = 软弱 型 
{wimp (E 0.1 的 概率 ), t= 粗暴 型 (surly) (以 0.9 的 概率 )。 发 送 者 的 
信号 是 早餐 选择 啤酒 还 是 热狗 ;接收 者 的 行动 是 决定 是 否 与 发 送 者 挑 起 冲 
突 。 备 方 收益 情况 表现 出 如 下 特征 :软弱 类 型 偏好 选择 热狗 作 早 餐 ,粗暴 类 
型 偏好 啤酒 ,两 种 类 型 者 不 愿意 同 接收 者 相 冲 突 (并 与 早餐 吃 什么 相 比 ,更 
关心 这 一 点 ) ;接收 者 则 偏好 与 软弱 类 型 挑 起 冲突 , 但 不 希望 村 粗暴 类 型 挑 
起 冲突 (可 以 看 出 , 如果 将 这 一 博 赛 中 类 型 .信号 和 行动 的 名 称 稍 作 更 换 , 就 
[以 成 为 进入 壁 休 模型 ,与 在 米尔 格 龙 和 罗 伯 欧 (1982) 中 的 分 析 相 似 )。 在 
图 4.4.3 的 扩展 式 表 述 中 ,享用 自己 所 慷 好 的 早餐 给 两 种 类 型 带 来 的 收益 
都 是 1, 而 避免 冲突 给 两 种 类 型 带 来 的 额外 收益 为 2。 接 收 者 通过 与 软弱 类 
型 (粗暴 类 型 ) 冲 突 获得 的 收益 分 别 为 1( -1); 所 有 其 他 情况 的 收益 为 0。 

在 这 一 博弈 中 ,{( 热 狗 , 热狗 ), (不 串 突 , RR), p =0.1, 9] 对 任意 o> 
1/2 构成 一 个 混同 精炼 贝 叶 斯 均衡 。 而 且 这 一 均衡 满足 信号 要 求 5, 因 为 啤 
酒 对 两 种 类 型 的 发 送 者 都 不 是 劣 信和 号。 具体 地 说 , 软弱 类 型 并 不 能 保证 选 
择 热狗 (最 低 的 收益 为 1) 一 定 比 选择 啤酒 (最 高 收益 为 2) 要 好 。 但 另 一 方 
面 ,接收 者 均衡 路 径 之 外 的 推断 的 确 令 人 可 疑 :如 果 接 收 者 意料 之 外 地 观测 


Bj 
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到 啤酒 , 则 他 推测 发 送 者 与 粗暴 型 至 少 有 同样 的 可 能 性 是 软弱 型 ( 即 9 之 1/ 
2), 即 使 (a) 软 弱 型 选择 啤酒 并 不 能 提高 他 选择 热狗 时 的 均衡 收益 ;(b) 粗 暴 
型 可 能 将 其 收益 从 均衡 条 件 的 2 提高 到 3, 只 要 接收 者 持 有 的 推断 gq < 1/2。 
给 定 (a) 和 (b), 可 以 期 望 粗 暴 类 型 在 选择 啤酒 之 后 作出 如 下 表白 ， 
看 到 我 选择 了 啤酒 ,你 应 该 相信 我 属于 粗 关 类 型 :选择 啤酒 无 法 提 

高 软弱 类 型 的 收益 ,理由 如 (a); 并 且 如 果 选 择 啤酒 将 使 你 确信 我 是 粗 

暴 类 型 的 , 则 这 样 做 将 提高 我 的 收益 , 理由 如 (b)。 
如 果 这 样 的 表白 被 相信 了 , 就 可 得 到 g = 0, 它 与 上 面 的 混同 精炼 贝 叶 斯 均 
衡 是 互 不 相 容 的 。 

我 们 可 以 把 这 一 论证 推广 到 第 4.2.A 节 定 义 的 信号 博弈 类 型 , 由 此 得 
到 信号 要 求 6。 


定义 ”给 定 信号 博弈 中 的 一 个 精炼 中 叶 斯 均衡 , M 中 的 信号 mm) 称 为 
工 中 类 型 z; 9 F E F Cequilibrium-dominated for type ¢;), 如果 z; 的 均 
Me, AU" UER, 大 于 n 选择 zj 时 最 大 的 可 能 收益 ;: 
U? (n) > maU sC te mj, aa) 


信号 要 求 6 (“直观 标准 "”， 赵 和 克 雷 普 斯 ,1987); 如 果 mi 之 后 的 信 
息 集 处 于 均衡 路 径 之 外 , A m 为 类 型 上 的 均衡 劣 信 号 , 则 (在 可 能 的 情况 
下 ) 接 收 者 的 推断 pg (ti1mj) 中 分 配给 类 型 i 的 概率 应 该 等 于 0( 如 果 mj 不 
对 工 中 所 有 的 类 型 都 是 均衡 劣 信 号 , 即 属 要 求 中 的 “可 能 情况 ”)。 
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“啤酒 或 热狗 "证 明了 一 个 信号 om, 可 以 是 4; 的 均衡 劣 信号, 即使 它 非 
5 的 劣 信 号 。 不 过 , 如 果 mm 为 二 的 劣 信号 , m 一 定 为 1; 的 均衡 劣 信 号 ， 
于 是 信号 要 求 6 的 限定 使 得 信号 要 求 5 成 为 多 余 。 赵 和 克 雷 普 斯 运用 科 尔 
1045 FORE BT (Kohlberg & Mertens, 1986) 发 展 出 的 更 强 的 结论 .证 明 所 有 
第 4.2.A 节 定义 的 信号 博弈 类 型 都 存在 满足 信号 要 求 6 的 精炼 贝 叶 斯 均 
衡 。 这 里 的 论证 运用 的 馆 辑 方法 有 时 称 为 “前 向 归纳 法 "(forward induc- 
tion)。 因 为 在 解释 背离 行为 时 一 一 即 在 形成 推断 po ( 2, | mj) 时 一 一 接收 者 
要 考 虚 发 送 者 过 去 的 行为 是 不 是 理性 的 , 而 道 向 归纳 法 则 假定 将 来 的 行为 
应 该 是 理性 的 。 

为 说 明 信 号 要 求 6, 我 们 用 它 来 分 析 第 4.2.B 节 中 就 业 市 场 信 号 模型 
存在 嫉 妨 的 情况 。 前 面 已 讲 到 ,在 这 一 模型 中 存在 大 量 的 混同 ,分 离 以 及 杂 
合 精炼 贝 叶 斯 均衡 。 但 出 人 意料 的 是 , 这 些 均衡 中 只 有 一 个 分 离 均 衡 可 以 
通过 信号 要 求 6 的 检验 一 一 在 此 分 离 均 衡 中 , 低能 力 的 工人 选择 自己 完全 
信息 集 条 件 下 的 教育 水 平 ,高 能 力 工人 选择 的 教育 水 平 较 高 , 并 恰好 使 低能 
力 工人 模仿 高 能 力 工 人 不 会 带 来 更 高 的 收益 , 如 图 4.4.4 所 示 。 


1, 


A yHe) 


yiL. e} 


e*(ly es e 
图 4.4.4 


在 任意 的 精炼 灵 叶 斯 均衡 中 , 如 果 工 人 选择 教育 水 平 e, 且 企业 据 此 推 
断 工人 是 高 能 力 的 概率 为 x(Hie), 则 工人 的 工资 将 等 于 
w(e)=p(Hle)ty(H,e)+[1- (Hle) yL, e)l. 
那么 , 低能 力 工人 选择 。”( 工 ) 的 效用 至 少 等 于 y[ 工 , e"(L)]-clL, e" 
(L)) , 它 大 于 工人 选择 任何 。> e 时 的 效用 ,不 论 企业 在 观测 到 。 之 后 所 
持 有 的 推断 如 何 。 用 信号 要 求 5 的 话 来 说 , 就 是 对 低能 力 类 型 的 工人 ,任何 
大 于 e 的 教育 水 平 。 都 是 劣 信号 。 简 要 地 说 , 信号 要 求 5 限定 对 。>e, 的 
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推断 (Hle》=1, 它 又 意味 着 高 能 力 工人 选择 o> ec, 的 分 离 均衡 不 能 满足 
要 求 $, 因 为 在 这 样 一 个 均衡 中 企业 必须 对 e, Me 之 间 的 教育 水 平 推断 p 
(8ie)<1。( 精 确 的 表述 为 :信号 要 求 5 限定 了 对 e>e, 由 于 e 不 是 高 能 
力 类 型 的 劣 信号 ,应 该 有 no (He) = 1; 但 如 果 存 在 一 个 分 离 均 衡 , 其 中 高 能 
力 工 人 选择 的 教育 水 平 >e, W e He 之 间 的 信号 不 是 高 能 力 类 型 的 劣 信 
号 ,于 是 论证 通过 。) 因 此 ,惟一 满足 信号 要 求 5 的 分 离 均衡 就 是 图 4.4.4 中 
所 示 的 均衡 。 

从 上 面 的 论证 中 还 可 以 得 到 另 一 个 结论 :在 满足 信号 要 求 5 的 任何 均 
衡 中, 高 能 力 工人 的 效用 一 定 至 少 等 于 y(HH,e,) 一 c(H, e), FERIEN 
这 一 点 意味 着 一 些 混 同 及 杂 合 均衡 不 能 满足 信号 要 求 5。 根 据 工人 是 高 能 
力 的 概率 (9) 是 否 足 够 低 ,使 得 工资 函数 w= ge y (Hoe) + (~g) ytl, 
e) 处 于 高 能 力 工人 通过 点 [e, y PH,es)] 的 无 差异 曲线 的 下 方 , 可 以 分 为 两 
种 情况 。 

首先 , 我们 假设 9 值 很 低 , 如 图 4.4.5 所 示 。 在 这 种 情况 中 , 没有 混同 
均衡 可 以 满足 信号 要 求 5, 因为 在 这 样 的 均衡 中 高 能 力 工 人 的 效用 水 平 无 
法 达到 yH, e) -ctei)。 类 似 地 ,高 能 力 工 人 随机 选择 售 导 的 杂 会 均 
衡 也 不 能 满足 信号 要 求 5, 因为 在 这 样 的 均衡 中 ,混同 发 生 的 (教育 ,工资 ) 
点 处 于 工资 函数 w= gy(H,e)+ (1- g)'y(L,e) 的 下 方 。 最 后 ,低能 力 
工人 随机 选择 信号 的 杂 合 均衡 也 不 能 满足 信号 要 求 5, 因为 在 这 样 的 均衡 
中 ,混同 发 生 的 (教育 , 工资 ) 点 一 定 处 于 低能 力 工人 通过 点 [e"( 工 )， w 
( 工 )] 的 无 差异 曲线 之 上 , 如 图 4.2.9 所 示 , 从 而 就 位 于 高 能 力 工 人 通过 点 
fen 3( 万 ,e:)] 的 无 差异 曲线 之 下 。 综 上 , 在 图 4.4.5 所 示 的 情况 下 , 惟 


ly 


y( He) 


4 y(H,e) 
+(1-g)y(Le) 


yl, 
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一 满足 信号 要 求 5 的 精炼 贝 叶 斯 均衡 就 是 图 4.4.4 所 表示 的 分 离 均 
io 

现在 我 们 假设 ¢ 值 较 高 , 如 图 4.4.6 所 示 。 与 上 面 的 情况 相似 , 低能 
力 工人 随机 选择 信号 的 杂 合 均衡 不 能 满足 信号 要 求 5, 但 这 时 混同 均衡 和 
高 能 力 工人 随机 选择 信号 的 杂 合 均衡 却 可 能 满足 信号 要 求 5, 只 要 混同 发 
生 的 (教育 , 工资 ) 点 位 于 图 中 阴影 区 域 之 内 。 然 而 ,这样 的 均衡 却 无 法 满足 
信号 要 求 6。 


f de ye) 
n 


q yH, e 
+(1—- DYy(Ley 


WL, e) 


w*(L) 


4.4.6 


考 灌 图 4.4.7 所 示 的 混同 于 ez 的 均衡, 教育 水 平 选择 e> e 对 低能 力 
类 型 来 讲 是 均衡 尘 信 号 , 因为 即使 支付 在 教育 水 平 e 之 下 的 景 高 的 工资 
一 一 具体 地 说 ,为 yCH,e), 得 到 的 (教育 ,工资 ] 点 也 处 于 低能 力 工人 通过 
均衡 点 (es, zop) 的 无 差异 曲线 的 下 方 。 不 过 ,位 于 e“ 到 e" 之 间 的 教育 选择 ， 
却 不 是 高 能 力 类 型 的 均衡 劣 信号 :如 果 这 样 一 个 选择 可 使 企业 确信 自己 是 
属于 高 能 力 类 型 的 , 则 企业 所 给 的 工资 为 y( 瑟 ,e), 它 可 使 高 能 力 工人 的 福 
利 比 前 面 混同 均衡 下 有 所 提高 。 那 么 ,如果 。 <e<e’, MASER 6 就 限 
定 了 企业 的 推断 必须 为 x(Hle)= 1, 它 又 意味 着 我 们 讨论 的 混同 均衡 不 能 
满足 信号 要 求 6, 因为 在 这 样 一 个 均衡 中 , 企业 对 处 于 e“ 和 。” 之 间 的 教育 水 
平 的 推断 必须 为 (Hle)<1。 这 一 论证 同样 适用 于 图 中 阴影 区 域 之 内 的 
所 有 混同 及 杂 合 均衡 。 于 是 ,满足 信号 要 求 6 的 惟一 精炼 贝 叶 斯 均衡 就 是 
图 4.4.4 所 示 的 分 离 均衡 。 
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hh nH,e) 


q WAH,e), 
+1 -gy(Le) 


Le) 


4.5 进一步 阅读 


米尔 格 龙 和 罗 伯 欧 (1982) 提 供 了 信和 号 博弈 在 产业 组 织 理论 领域 的 经 典 
应 用 。 在 公司 财务 理论 方面 , 巴 塔 查 里 亚 (1979) 及 利 兰 (Leland) 和 演 尔 
(Pyle)(1977) 运 用 信和 号 模型 分 别 分 析 了 股利 政策 以 及 股份 所 有 权 管 理 。 在 
货币 政策 方面 , 罗 厂 夫 (1989) 总 结 了 重复 博弈 、 信 号 以 及 声誉 模型 , 鲍 尔 
《1990) 运 用 联储 类 型 随时 间 发 生 的 (不 可 观测 的 ) 变 化 解释 通货 膨胀 的 时 间 
路 径 。 关 于 空谈 博弈 的 应 用 , 参见 书 中 已 介绍 过 的 奥斯汀 和 史密斯 (1990)， 
法 雷 尔 和 吉本 斯 (1991), 马 修 斯 (1989) 以 及 斯 坦 (1989) 的 论文 。 凯 南 
(Kennan) 和 威尔逊 (1992) 对 非 对 称 信息 谈判 的 理论 及 经 验 模型 进行 了 一 
个 综述 , 并 强调 罢工 及 诉讼 所 发 挥 的 作用 。 克 兰 顿 (Cramton》 和 特 拉 西 
(Tracy)(1992) 允许 工会 选择 是 枫 工 还 是 忍耐 ( 即 在 前 期 的 工资 下 继续 工 
作 ); 他 们 证 明理 论 上 经 常会 发 生 忍 耐 , 并 且 这 一 模型 可 对 许多 经 验 中 的 罢 
工 提供 解释 。 关 于 声 兴 ,参见 索 贝尔 (1985) 的 论文 “信心 理论 ", 其 中 知情 的 
一 方 在 一 系列 的 空谈 博弈 中 , 既 可 能 是 不 知情 决策 者 的 “朋友 ", 也 可 能 是 其 
“ 栈 人 "”。 最 后 ,参见 丘 (Cho) 和 过 贝尔 (1990) 关 于 在 信号 博弈 中 进行 再 精 
炼 的 进一步 内 容 , 包括 在 斯 豆 斯 模型 存在 多 于 两 种 类 型 时 ,通过 再 精炼 挑选 
有 效率 的 分 离 均衡 。 
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4.6 JA 


第 4.1 节 

4.1 对 下 面 的 扩展 式 博弈 , 推导 其 标准 式 博弈 , 并 且 找 出 所 有 的 纯 战 
略 纳什 均衡 . 子 博 弈 精炼 纳什 均衡 以 及 精炼 只 叶 斯 均衡。 

4.2 证 明 在 下 面 的 扩 晨 式 博弈 中 ,不 存在 纯 战 略 精炼 贝 叶 斯 均衡 。 并 
求 出 其 混合 战略 精炼 只 叶 斯 均衡 ? 


+ 


(习题 4. 1b) 


第 4.2 节 
4.3 a. 写 出 下 面 的 信号 博弈 的 一 个 混同 精炼 员 时 斯 均衡 , 其 中 两 种 
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类 型 的 发 送 者 都 选择 信号 Ro 


12 


0,0 


3,1 


(习题 4. 3a) 


b. 下 面 的 三 类 型 信号 博弈 由 自然 的 行动 开始 ,没有 在 树 圭 表示 出 来 ， 
以 同样 的 概率 赋予 发 送 者 三 种 类 型 中 的 一 种 。 写 出 一 个 混同 精炼 中叶 斯 均 
衡 ,其 中 三 种 类 型 的 发 送 者 都 选择 信号 Le 

4.4 写 出 以 下 信号 博 蛮 中 所 有 的 纯 战 略 混同 及 分 离 精炼 贝 叶 斯 均 
衡 。 
4.5 求 出 习题 4.3(a) 和 (b) 申 的 所 有 纯 战 略 精炼 贝 叶 斯 均衡 。 
4.6 下 面 的 信号 博弈 属于 与 医 4.1.1 相同 类 型 的 完全 非 完 美 信息 动 
SR. SMe, 和 1s 可 以 看 成 图 4.1.1 中 参与 者 1 的 行动 工 和 Mi 如 果 
税 号 博弈 中 的 发 送 者 选择 了 R, 则 事实 上 博弈 已 经 结束 , 与 图 4.1.1 中 参与 
者 1 选择 R 的 情况 类 似 。) 求 出 此 信和 号 博弈 的 (i) 纯 战略 贝 叶 斯 纳什 均衡 ; 


(习题 4. 2b) 
( 襄 纯 战略 精 烽 雅 叶 斯 均衡 。 并 分 别 将 (D 和 (ii) 与 图 4.1.1 中 的 纳什 均衡 
及 糖 烽 贝 叶 斯 均衡 相 比较 。 
4.7 画 出 两 类 型 就 业 市 场 信号 模型 中 的 无 差异 曲线 和 生产 函数 , 并 写 
出 它 的 一 个 准 分 离 精 炼 贝 叶 斯 均衡 , 其 中 高 能 力 工人 随机 选择 信号 。 


第 4.3 节 

4.8 BUFR SRB OUT. BRR eH 
类 型 的 概率 相等 。 和 图 4.3.1 相同 ,每 一 单元 格 的 第 一 个 值 表示 发 送 者 收 
益 , 第 二 个 信和 表示 接收 者 收益 , 但 该 图 却 不 表示 一 个 标准 式 博弈 ,而 只 是 给 
出 每 一 类 型 行动 组 合 下 参与 者 的 收益 情况 。 


t u 3 


a 0.1 0,0 0,0 
az 1,0 1.2 1,0 


as 0,0 0.0 20 


4.9 ”考虑 第 4.3.A 节 讨 论 的 克 劳 福 德 和 索 贝 尔 空谈 模型 的 岗子 :发 
送 者 的 类 型 均匀 分 布 于 从 0 到 1 的 区 间 ( 正 式 地 ,T= [0,1] 且 对 械 中 的 所 
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2,2 


0.0 


1,0 


e111 
(习题 4. 4a) 


h R 
01 (习题 4. 6) 
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Alc, pls) = 1) 47 SA 0 Bl 1 ASK (A = (0,19), BUS i R 
BOW Url, a)= -ta-t)2; 发 送 者 的 收益 函数 为 Us{1,a)= -fa-(i1+ 
5)]?。 对 什么 样 的 5 值 , 存在 三 段 均衡 ? 在 三 段 均衡 和 二 段 均衡 中 , 接收 
者 的 期 望 收 益 哪 个 更 高 ? 哪些 类 型 的 发 送 者 在 三 段 均衡 中 能 够 得 到 更 高 的 
收益 ? 

4.10 两 个 合 狄 人 必须 就 其 合伙 企业 进行 清算 。 合 伙 人 1 现在 拥有 的 
权益 份额 为 s, 合 伙 人 2 拥有 1-s。 两 合伙 人 间 意 进行 如 下 博弈 :合伙 人 1 
提出 一 个 价格 p PRR AKA 2 可 以 选择 以 ps 的 价格 购买 合伙 人 1 的 股 
HRA PK1-s) 的 价格 将 自己 的 股份 卖 给 合伙 人 1。 假 设 两 个 合伙 人 对 
拥有 全 部 企业 价值 的 估价 相互 独立 , 且 服 从 [0, 1 区 间 的 均匀 分 布 , 以 上 是 
共同 知识 。 但 每 一 合伙 人 的 估价 是 私人 信息 。 求 出 博弈 的 精炼 贝 叶 斯 均 
衡 。 

4.11 买方 和 吉方 对 商品 的 估价 分 别 为 w 和 mw。 交易 能 够 带 来 净 收 
SE CBM we > ws) 是 共同 知识 ,但 收益 的 大 小 却 是 私人 信息 , 具体 情况 如 下 38 
方 的 估价 服从 [0,1] 区 间 的 均匀 分 布 ;买方 的 估价 me = bv, AE k> 
共同 知识 ;卖方 了 解 v,( 从 而 知道 ww), 但 买方 却 不 清楚 v (或 w)。 假 设 买 
方 给 出 一 个 单一 买 价 ,卖方 既 可 以 接受 , 又 可 以 拒绝 。 当 上 < 2 时 ,博弈 精 
PM OMIM ETA? 2>2 时 呢 ? (BIB R984) 

4.12 本题 考虑 第 4.3.B 节 分 析 的 两 阶段 谈判 博弈 无 限期 进行 下 去 
的 情况 。 和 前 面 的 假定 相同 , 企业 对 自己 的 利润 (xz) 拥 有 私人 信息 , n 服从 
[0.ro] 区 闻 的 均匀 分 布 ,所 有 阶段 都 由 工会 提出 工资 要 价 , 且 有 一 个 保留 工 
RAK w, = 0。 

在 两 阶段 博弈 中 , 如果 a> ri, 企业 接受 工会 的 第 一 次 要 价 (w1), 这 里 
的 利润 类 型 n 使 下 面 两 种 情况 无 差异 (i) 接 受 wi1; (让) 拒绝 w, 并 接受 工 
会 第 二 期 的 要 价 we, 这 里 w 是 企业 利润 服从 [0, mw] 上 的 均匀 分 布 且 谈判 
到 了 最 后 一 期 时 工会 的 最 优 要 价 。 在 无 限期 的 情况 下 , 与 此 不 同 的 是 , wz 
是 企业 利润 服从 [0, xj] 上 的 均匀 分 布 , 且 在 谈判 还 要 (潜在 地 ) 继 续 无 限期 
地 进行 下 去 的 条 件 下 ,工会 的 最 优 要 价 。 尽 管 xi 仍 是 使 选择 (让 和 (i 无 差 
异 的 利润 类 型 , wz 的 变化 将 导致 xi 也 发 生变 化 。 

冶 于 无 限期 博弈 第 二 期 的 后 续 博 弈 在 性 质 上 相当 于 整个 博弈 :依然 存 
在 潜在 的 无 限期 谈判 , 并且 企 业 的 利润 仍 最 从 0 到 一 个 上 限 间 的 均匀 分 
布 :惟一 的 区 别 就 是 这 里 的 上 限 不 再 是 ro, MEH x. RIRA D 
《1983) 证 明 , 无 很 期 捕 穿 存在 一 个 静态 的 精炼 贝 叶 斯 均衡 。 在 这 一 均 梧 中， 
如 果 企 业 的 利润 服从 0 到 x* 之 间 的 均匀 分 布 , 则 工会 开 出 的 工资 要 价 为 
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wn = be", FRR RH bro HOM bn, 如 此 等 等 。 如 果 工 
会 选择 上 面 的 静态 战略 , 企业 的 最 优 反 应 可 以 求 得 为 m, = cro, w = cw, 如 
此 等 等 , 并 且 当 企业 利润 服从 0 到 x* 区间 的 均匀 分 布 时 , 工会 期 望 收 益 的 
SUB Vin" = dxr*。 WEH 6 =2d,c=1/[1+ V1-65] 且 d=[V1-8- 
(1-6)1/26. 

4.13 ”企业 和 工会 进行 下 面 的 两 阶段 谈判 博弈 。 企 业 利润 xt ARMA 0 到 
1 之 间 的 均匀 分 布 , 工会 的 保留 工资 为 w 以 上 都 是 共同 知识 , 只 有 企业 才 
了 解 x 的 真实 值 。 假 定 0< zwr< 172, 求 出 下 面 博弈 的 精炼 贝 叶 斯 均衡 : 

1. 在 第 一 阶段 的 开始 ,工会 向 企业 提出 一 个 工资 要 愉 wis 

2. 企业 或 接受 或 拒绝 w, 如 果 企 业 接受 w, 则 两 阶段 都 可 以 开工 生 

产 , 于 是 工会 的 收益 为 2w, 企业 收益 为 2(x- w) (BRR 
素 )。 如 果 企 业 拒 绝 wi, 则 第 一 期 就 没有 产 出 , 且 企业 和 工会 第 一 
阶段 的 收益 都 等 于 0; 

3. 在 第 二 阶段 的 开始 ( 狠 定 企业 拒绝 了 w) 企业 向 工会 提出 一 个 工 
资 出 价 waz( 不 同 于 索 贝 尔 和 高 桥 的 模型 , 这 一 出 价 不 再 由 工会 提 
出 ); 

4. 工会 或 接受 或 拒绝 这 一 出 价 , 如 果 工 会 接受 w, 则 第 二 期 会 有 产 
出 ,于 是 第 二 期 (也 是 全 部 ) 的 收益 为 工会 w, 企业 r- rz( 前 面 已 
讲 过 第 一 期 的 收益 为 0)。 如 果 工 会 拒绝 wz, 则 没有 产 出 ,工会 在 第 
二 期 赚 得 其 保留 工资 w, 企业 关闭 , 收益 为 0。 

4.14 纳 莱 巴 夫 (Nalebuff,1987) 分 析 了 下 面 的 原告 和 被 告 之 间 在 开庭 
审判 前 谈判 的 寞 型。 如果 案件 交 到 法 庭 , 被 告 被 迫 支付 给 原告 损害 赔偿 d, 
服从 从 [0,1] 区 间 的 均匀 分 布 ,只 有 被 告 才 知 道 a 的 真正 值 , 以 上 是 共同 
知识 。 交 到 法 庭 则 使 原告 花费 <<1/2, 但 (为 简单 起 见 ) 不 增加 被 告 的 成 
本 。 

博 蛮 时 间 顺 序 如 下 :(1) 原 告 提出 一 个 解决 方案 要 约 *;i(2) 被 告 选择 接 
受 和 解 (这 时 原告 的 收益 为 ;, 被 告 的 收益 为 - s) 或 者 拒绝 ;(3) 如 果 被 告 拒 
绝 ;, 则 原告 决定 到 法 庭 起 诉 ,这 时 源 告 的 收益 为 d - c, 被 告 的 收益 为 - 4， 
或 是 放弃 起 诉 , 这 种 情况 下 双方 参与 者 的 收益 都 为 0。 

在 第 (3) 阶 段 , 如 果 原 告 相信 存在 一 些 d * 的 值 , 当 且 仅 当 4z> ce 时 被 
告 将 选择 和 解 ,原告 关于 是 否 起 诉 的 最 优 决策 是 什么 ? 在 第 (2) 阶 段 , 对 给 
定 的 要 的 s, 如 果 被 告 推断 拒绝 后 原告 将 向 法 庭 起 诉 的 概率 为 p, 被 告 的 类 
型 为 d 时 ,其 最 优 的 和 解决 策 是 什么 ? 如 果 要 约 ;>2c, 开始 于 阶段 (2) 的 
连续 博弈 的 精炼 贝 叶 斯 均衡 是 什么 ? 如 果 要 约 *<2c WE? 如 果 <<1/3, 求 
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出 整个 博弈 的 精炼 贝 叶 斯 均衡 。 如 果 1/3 << 1/2 W? 

4.15 ”考虑 一 个 立法 过 程 , 其 中 可 行 的 政策 从 p=0 到 p=1 之 间 连 续 
波动 。 图 会 理想 中 的 政策 为 <, 但 政策 现状 为 *, 这 里 0< c< < 1, 也 就 是 
说 ,国会 理想 中 的 政策 位 于 现行 政策 的 左 侧 。 总 统 认为 的 理想 政策 为 :, 服 
从 [0,1] 区 间 上 的 均匀 分 布 , 但 属 总 统 本 人 的 私人 信息 。 时 间 顺 序 非常 简 
单 : 国 会 提议 一 个 政策 ,总 统 可 以 选择 签署 还 是 否决 。 如 果 p 被 签署 通 
过 , 则 国会 的 收益 为 -《c - p)》?, 总 统 的 收益 为 -(z — p PS p MR, 
则 收益 分 别 为 一 (c -和 -~(i-s)2。 什 么 是 精炼 贝 叶 斯 均衡 ? 证 明 在 
HEP e< ps 

现在 ,假设 在 国会 提出 政策 议案 之 前 .总 统 可 以 发 表 一 篇 演说 { 即 可 发 
送 一 个 空谈 信号 ) 。 考 虑 一 个 两 阶段 精炼 贝 叶 斯 均衡 ,其 中 国会 根据 总 统 发 
送 哪 一 种 信号 ,而 选择 议案 pr 或 pr。 证 明 在 这 样 的 均衡 中 不 可 能 有 e< 
PLS py<s。 并 解释 为 什么 由 此 可 以 推出 均衡 中 , 国会 的 议案 不 可 能 有 三 
个 或 更 多 ? 推导 在 c= pL < pn<s 条 件 下 的 两 段 均衡 的 详细 结果 : 哪 种 类 
ROARS, 且 pu 的 值 是 什么 ? (参见 马 修 斯 , 1989) 


第 4.4 节 

4.16 考虑 习题 4.3(a) 和 (b) 描 述 的 混同 均衡 。 对 每 一 个 均衡 :检验 
支持 该 均衡 的 推断 是 否 满足 信号 要 求 5; 检验 支持 均衡 的 推断 是 否 满 足 信 
号 要 求 6( 直 观 标准 )。 
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